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LLVM 是 一 个 正在 发 展 中 的 前 沿 编译 器 技术 框架 ， 它 易于 扩展 并 设计 成 多 个 库 ， 可 以 为 编译 器 入 门 
者 提供 流畅 的 体验 ， 并 能 使 编译 器 开发 所 涉及 的 学 习 过 程 变 得 非常 顺畅 。 本 书 首先 介绍 如 何 配 置 、 构 
/NE Na NA 
式 ， 这 些 阶 段 包 括 : 前 端 、IR、 后 端 、JIT 引 擎 、 交 叉 编译 功能 和 插件 接口 。 本 书 还 提供 了 多 个 实际 操 
作 的 范例 和 源 代码 片段 ， 可 以 帮助 读者 坚实 而 顺利 地 掌握 LLVM 编 译 器 开发 环境 的 入 门 知 识 。 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ;也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 让， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华 章 公 司 较 早 意识 到 “出 版 要 为 教育 服务 ” 。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 遵 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson、 
McGraw-Hill、Elsevier、MIT 、John Wiley & Sons 、Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum 、Bjarne Stroustrup、 
Brian W. Kernighan、 Dennis Ritchie、 Jim Gray 、Afred V. Aho 、John E. Hopcroft、Jeffrey 
D. Ullman、 Abraham Silberschatz、William Stallings、Donald E. Knuth、John L. Hennessy、 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 
学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提 供 了 
中 肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 
500 个 品种 ， 这 些 书 籍 在 读者 中 树立 了 和 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 
深化 ,教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指 正 ， 我 们 的 联系 方法 如 下 : 

华章 网 站 : www.hzbook.com 

电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010 ) 88379604 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
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众所周知 ， 编 译 器 是 连接 软件 和 硬件 的 桥梁 ， 是 核心 基础 软件 。 尤 其 是 近年 来 计算 机 体 
系 结构 发 展 迅速 ， 大 数据 、 人 工 智能 等 上 层 应 用 对 算 力 提出 了 更 高 的 要 求 ， 编 译 器 变 得 越 来 
越 重 要 了 。 编 译 器 本 质 是 将 一 种 高 级 语言 翻译 为 低级 语言 的 程序 ， 通 常 包括 前 端 、 优 化 器 、 
后 端 等 。 前 端 负责 解析 高 级 语言 ， 将 程序 转换 为 内 部 的 中 间 表 示 格 式 ; 优化 器 基于 中 间 表 示 
进行 优化 ; 而 后 端 则 负责 低级 语言 代码 生成 。 

由 于 编译 器 的 特殊 性 ， 它 涉及 的 计算 机 知识 包括 计算 理论 、 体 系 结构 和 软件 工程 。 在 解 
析 高 级 语言 时 ， 编 译 器 涉及 的 计算 理论 包括 正则 语法 、 有 限 状 态 自动 机 、 上 下 文 无 关 文法 、 
下 推 自 动机 等 。 编 译 器 需要 生成 的 低级 语言 通常 是 目标 体系 结构 的 机 器 语言 ， 因 此 需要 结合 
体系 结构 的 特点 进行 指令 选择 、 寄 存 器 分 配 等 。 从 软件 工程 的 角度 来 说 ， 编 译 器 有 着 和 操作 
系统 内 核 相 近 的 复杂 度 。 例 如 ， 运 用 广泛 的 GCC 编译 器 有 700 万 行 代码 ， 而 Linux 内 核 代 
码 有 1500 万 行 左 右 。 

LLVM 起 源 于 伊利 诺 伊 大 学 厄 巴 纳 - 香槟 分 校 的 一 个 开源 项 目 ， 初 始 目的 是 开发 一 套 程 
序 的 低层 表达 。 这 也 是 LLVM 名 称 的 来 源 ， 即 Low Level Virtual Machine (低级 虚拟 机 ) 的 
缩写 。LLVM 的 低层 表达 采用 静态 单 赋值 (SSA) 形式 ， 它 在 开源 后 受到 广泛 的 好 评 和 关注 ， 
目前 已 经 发 展 出 完整 的 编译 器 基础 设施 。 它 支持 C、C++、Objective-C 等 高 级 语言 ， 并 支持 
静态 和 动态 编译 方式 。 现 在 采用 和 开发 LLVM 的 公司 包括 Apple、Google 和 NVIDIA 等 主 
流 计 算 机 企业 。 

LLVM 荣获 2012 年 ACM 软件 系统 奖 ， 其 成 功 之 处 主要 在 于 统一 的 低层 中 间 表 达 以 及 
极致 、 模 块 化 的 软件 工程 方法 。LLVM 也 采用 了 编译 器 中 常见 的 “前 端 - 优 化 器 -后 端 ” 组 
织 形式 ， 只 是 不 同 的 前 端 和 后 端 都 采用 统一 的 低层 中 间 表 示 格 式 (LLVM IR) 将 二 者 进行 解 
耦 并 最 大 可 能 地 复 用 优化 器 的 代码 。 另 外 ，LLVM 抽象 和 剥离 了 不 同 的 编译 流程 ， 用 户 可 以 
调用 指定 的 单个 或 者 多 个 编译 流程 。 这 也 是 LLVM 和 GCC 编译 器 的 区 别 所 在 。GCC 是 一 
个 庞大 的 软件 ， 很 难 对 其 进行 二 次 修改 。 而 LLVM 通过 良好 设计 的 编译 流程 的 接口 ， 有 着 
更 为 广泛 和 灵活 的 应 用 场景 它 既 可 以 用 于 静态 编译 器 ， 也 可 以 用 于 即时 编译 器 ， 甚 至 可 以 
仅仅 调用 其 中 的 某 些 API。LLVM 现在 被 作为 实现 各 种 静态 和 运行 时 编译 语言 (GCC 家 族 、 
Java、.NET、Python 、Ruby、Scheme、Haskell、D 等 ) 的 通用 基础 设施 。 

由 于 其 良好 的 设计 ，LLVM 的 意义 不 仅仅 在 于 一 个 编译 器 。LLVM 对 于 新 的 编程 语言 
和 新 型 芯片 开发 也 有 很 好 的 促进 作用 。LLVM 的 IR (中 间 表 示 ) 设计 理念 从 一 开始 就 具有 
可 移植 特性 ， 可 以 适 配 多 种 编程 语言 和 多 种 硬件 平台 。 因 此 ， 新 的 编程 语言 开发 只 需 设 计 一 
个 新 的 前 端 ， 而 新 型 芯片 的 开发 内需 设计 一 个 新 的 后 端 ， 这 样 大 大 缩短 了 开发 流程 。 此 外 ， 
LLVM 还 可 以 用 于 编译 器 插件 开发 ， 例 如 代码 规范 检查 、 代 码 优 化 等 。 总 而 言 之 ，LLVM 在 
现代 计算 机 系统 栈 中 的 地 位 举足轻重 。 

LLVM 的 优点 使 得 它 比 传统 GCC 编译 器 更 加 简单 易 懂 ， 代 码 更 具 可 读 性 。 特 别 是 
LLVM 的 模块 化 代码 设计 使 其 代码 修改 或 者 增加 更 加 容易 ， 因 此 国外 很 多 大 学 都 把 LLVM 
用 于 教学 实践 。 本 书 主要 曾 述 LLVM 的 模块 化 设计 理念 并 详解 不 同 模块 的 细节 ， 两 位 作者 





Bruno Cardoso Lopes 和 Rafael Auler 都 是 LLVM 项 目的 贡献 者 。 

作为 本 书 的 译 者 ， 我 们 在 编译 器 领域 有 着 丰富 的 经 验 ， 一 位 长 期 从 事 编 译 和 并 行 计算 研 
究 ， 另 一 位 在 博士 期 间 协助 导师 将 LLVM 运用 于 编译 课程 的 教学 之 中 。 我 们 所 在 的 科研 团 
队 在 使 用 LLVM 开发 面向 系统 底层 的 软件 (比如 任务 调度 器 、GPU 加 速 程序 等 ) 和 教学 过 
程 中 ， 深 感 需要 一 本 系统 介绍 LLVM 的 中 文书 籍 ， 这 是 译 者 翻译 本 书 的 初衷 。 在 翻译 过 程 
中 ,， 译 者 尽 最 大 的 努力 还 原作 品 的 原意 ， 遵 循 了 专 有 名 词 的 通用 翻译 ， 对 于 没有 约定 俗 成 的 
术语 翻译 ， 则 在 给 出 译文 的 同时 也 把 英文 原文 附 上 。 本 书 的 特点 是 紧密 结合 LLVM 的 源码 ， 
帮助 有 一 定编 译 器 知识 基础 的 读者 快速 掌握 LLVM。 

在 本 书 的 翻译 过 程 中 ， 上 海 交 通 大 学 新 兴 并 行 计算 团队 的 研究 生 张 大 、 蔡 晓 晴 、 印 宇 
贤 、 郭 聪 、 崔 炜 凰 、 周 杨 杰 、 刘 子 汉 为 本 书 的 译文 和 校对 出 力 良 多 ， 在 此 均 致 谢 忱 ! 

限于 译 者 中 英文 水 平 ， 译 文 可 能 存在 欠 妥 之 处 ， 敬 请 读者 不 音 赐 正 。 


过 敏 意 ”冷静 文 
于 上 海 交 通 大 学 闵行 校区 
2019 年 3 月 12 日 
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LLVM 是 一 个 非常 具有 启发 意义 的 软件 项 目 ， 它 起 始 于 Chris Lattner 个 人 对 编译 器 的 热 
情 。LLVM 最 初版 本 发 行 后 出 现 的 一 系列 事件 以 及 后 来 被 广泛 采用 的 经 历 也 遵循 了 一 种 其 他 
开源 项 目 常见 的 成 功 发 展 模式 : 这 些 项 目 通 常 是 人 们 对 某 个 问题 的 强烈 好 奇 心 的 产物 ， 并 非 
始 于 某 个 公司 。 例 如 ， 第 一 个 Linux 内 核 的 诞生 源 于 一 名 芬兰 学 生 对 操作 系统 领域 的 兴趣 ， 
因而 产生 了 强烈 动机 去 理解 和 实践 一 个 真正 的 操作 系统 应 该 如 何 工 作 。 

对 于 Linux 或 LLVM， 许 多 程序 员 的 贡献 使 它们 迅速 成 长 为 一 流 软 件 ， 在 质量 上 可 以 与 
现 有 的 任何 其 他 竞争 对 手相 媲美 。 因 此 ， 把 任何 一 个 大 项 目的 成 功 归功 于 特定 个 人 是 不 公平 
的 。 无 可 和 否认 的 是 ， 在 开源 社区 中 ， 一 个 学 生 的 软件 项 目 想 要 飞跃 成 为 复杂 且 健 壮 的 软件 需 
要 一 个 关键 因素 : 吸引 那些 愿意 在 该 项 目 上 花费 时 间 的 贡献 者 和 程序 员 。 

这 样 的 因素 天 然 存 在 于 充满 教育 气息 的 校园 氛围 之 中 。 教 育 的 重要 任务 是 教会 学 生理 解 
任务 的 工作 原理 ， 因 此 对 学 生 而 言 ， 他 们 可 以 在 解 开 错综复杂 的 机 制 并 最 终 掌 握 它 们 的 过 程 
中 享受 到 胜利 的 喜悦 。 伊 利 诺 伊 大 学 厄 巴 纳 - 香槟 分 校 (UIUC) 的 LLVM 项 目 正 是 在 这 种 
环境 下 发 展 起 来 的 ， 它 既 被 用 作 研 究 原型 ， 也 被 用 作 Lattner 的 硕士 导师 Vikram Adve 讲授 
编译 器 课程 的 教学 框架 。 学 生 们 为 最 初 的 bug 排查 做 出 了 贡献 ， 这 也 为 LLVM 最 终 成 为 一 
个 设计 良好 且 易 于 学 习 的 项 目 葛 定 了 发 展 方向 。 

软件 理论 和 实践 之 间 的 显著 差异 使 许多 计算 机 科学 专业 的 学 生 感 到 困惑 。 计 算 理 论 中 
一 个 简洁 明了 的 概念 可 能 涉及 多 层级 的 实现 细节 ， 这 些 细 节 使 得 现实 中 的 软件 项 目 变 得 过 
于 复杂 而 无 法 让 人 们 掌握 ， 特 别 是 其 所 有 微妙 之 处 。 巧 妙 的 抽象 设计 是 帮助 人 类 大 脑 掌握 
项 目 所 有 层面 的 关键 : 从 高 层级 的 视图 (抽象 意义 下 的 程序 实现 和 工作 方式 ) 到 最 低层 级 的 
细节 。 

理论 与 实践 之 间 的 差异 在 编译 器 这 一 软件 中 尤为 显著 。 对 学 习 编译 器 工作 原理 有 极 大 热 
情 的 学 生 ， 在 理解 编译 器 的 实际 实现 时 常常 面临 艰巨 的 挑战 。 尽 管 学 校 已 经 教授 了 编译 器 的 
相关 理论 ， 但 在 LLYM 项 目 之 前 ， 如 果 充 满 好 奇 心 的 学 生 要 学 习 实 现 真正 的 编译 器 ，GCC 
项 目 是 少数 开源 选项 之 一 。 

然而 从 最 纯粹 的 意义 上 说 ， 软 件 项 目 反 映 的 是 其 创建 者 的 观点 。 这 些 观点 通过 跨 多 个 组 
件 对 模块 和 数据 表示 进行 抽象 来 实现 。 但 对 于 同一 主题 ， 程 序 员 可 能 有 不 同 的 看 法 。 因 此 ， 
对 于 GCC 这 样 已 有 近 30 年 历史 的 老 旧 软件 库 而 言 ， 其 中 集合 了 不 同时 代 的 程序 员 的 不 同 观 
点 ， 这 使 得 该 软件 越 来 越 难以 被 新 程序 员 和 好 学 者 理解 。 

LLVM 项 目 不 仅 吸 引 了 经 验 丰富 的 编译 器 程序 员 ， 还 吸引 了 许多 年 轻 且 具有 好 奇 心 的 
从 事 科研 的 学 生 ， 他 们 从 中 看 到 一 片 更 干净 、 更 简单 的 黑客 土壤 ， 它 代表 了 一 个 具有 很 大 洪 
力 的 编译 器 。 这 一 点 可 以 从 选择 LLVM 作为 研究 原型 的 科学 论文 的 庞大 数量 得 到 验证 。 学 
生 们 做 出 如 此 选择 的 原因 很 简单 : 在 学 术 界 ， 学 生 通 常 负责 项 目的 具体 实现 ， 因 此 对 他 们 来 
说 ， 掌 握 实 验 框架 代码 库 对 于 研究 是 至 关 重要 的 。 由 于 LLVM 使 用 C++ 语言 (而 不 是 GCC 
中 使 用 的 C)、 模 块 化 (而 不 是 GCC 的 单一 庞大 结构 ) 以 及 更 容易 映射 到 现代 编译 器 理论 的 
概念 ， 因 此 ， 很 多 研究 人 员 发 现 修改 LLVM 代码 以 实现 他 们 的 科研 想法 是 很 容易 的 ， 并 且 
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有 很 多 这 方面 成 功 的 例子 。LLVM 在 学 术 界 的 成 功 可 以 说 是 理论 与 实践 之 间 缩 小 差距 的 结果 。 

除了 作为 科研 工作 的 实验 框架 之 外 ,与 GCC 的 GPL 许可 证 相 比 ，LLVM 项 目 还 有 更 加 
自由 的 许可 证 ， 因 而 引起 了 产业 界 的 兴趣 。 对 于 一 个 从 学 术 界 发 展 起 来 的 项 目 ， 编 写 其 代码 
的 研究 人 员 通 常会 担心 写 好 的 代码 在 用 于 单独 的 某 个 实验 后 遭遇 被 丢弃 的 命运 。 为 了 克服 这 
种 局 限 性 , 在 UIUC 的 硕士 项 目 中 ，Chris Lattner 决定 根据 伊利 诺 伊 大 学 /NCSA 开源 许可 协 
议 对 该 项 目 进 行 许可 ， 该 许可 只 要 求 保 留 版 权 声明 就 允许 包括 商用 目的 在 内 的 使 用 。Chris 
的 目标 是 使 LLVM 被 最 大 限度 地 采用 ， 最 终结 果 超 出 预期 。2012 年 ，LLVM 荣获 ACM 软 
件 系统 奖 ， 这 是 对 为 科研 做 出 杰出 贡献 的 软件 的 高 度 认可 。 

许多 商业 公司 基于 不 同 的 需求 使 用 LLVM 项 目 ， 也 为 该 项 目 做 出 不 同 的 贡献 ， 扩 展 了 
基于 LLVM 的 编译 器 可 以 使 用 的 语言 范围 以 及 能 够 为 其 生成 代码 的 机 器 范围 。 最 终 ，LLVM 
项 目 具 备 了 前 所 未 有 的 成 熟 的 库 和 工具 ， 进 入 了 新 的 阶段 : 从 学 术 软 件 的 实验 状态 ， 进 入 
被 商业 产品 使 用 的 健壮 框架 状态 。 因 此 ， 项 目的 名 称 也 从 低级 虚拟 机 ( Low Level Virtual 
Machine) 更 改 为 缩写 LLVM。 

停 用 低级 虚拟 机 的 名 称 ， 转 而 使 用 LLVM， 这 一 决定 反映 了 该 项 目 在 不 同时 期 的 目 
标 。 起 初 ，LLVM 是 一 个 硕士 科研 项 目 ， 目标 是 成 为 一 个 可 以 用 于 研究 程序 终身 优化 的 框 
架 。 相 关 工 作成 果 发 表 在 2003 年 MICRO ( 微 体 系 结构 国际 研讨 会 ) 的 一 篇 名 为 《 LLVA: A 
Low-level Virtual Instruction Set Architecture 》 的 论文 以 及 2004 年 CGO (代码 生成 和 优化 
国际 研讨 会 ) 的 一 篇 名 为 《 LLVM: A Compilation Framework for Lifelong Program Analysis 
久 Transformation 》 的 论文 中 。 前 者 描述 了 LLVM 的 指令 集 ， 而 后 者 对 整个 框架 进行 了 
描述 。 

在 学 术 环 境 之 外 ，LLVM 被 广泛 用 作 一 个 设计 良好 的 编译 器 ， 它 具有 将 中 间 表 示 写 人 磁 
盘 等 有 用 的 特性 。 在 商业 系统 中 ， 它 从 未 真正 像 Java 虚拟 机 (JVM) 一 样 被 使 用 ， 因 此 继续 
使 用 低级 虚拟 机 名 称 毫 无 意义 。 另 一 方面 ， 其 他 一 些 奇怪 的 名 字 仍 然 作 为 LLVM 的 历史 遗 
产 而 存在 。 在 磁盘 文件 中 存储 的 LLVM 中 间 表 示 程 序 称 为 LLVM 位 码 。 位 码 的 名 称 类 似 于 
Java 的 字 节 码 ， 但 前 者 反映 了 LLVM 中 间 表 示 所 需 的 空间 ， 与 Java 字 节 码 的 含义 不 同 。 

我 们 编写 此 书 有 双重 目的 。 首 先 ， 由 于 LLVM 项 目 发 展 速 度 很 快 ， 我 们 希望 将 其 循序 
渐进 地 呈现 给 你 ， 使 本 书 的 内 容 尽 可 能 简单 易 懂 ， 同 时 让 你 享受 使 用 功能 强大 的 编译 器 库 的 
乐趣 。 其 次 ， 我们 希望 唤起 你 开源 黑客 的 精神 去 探索 超出 本 书 的 概念 ， 永 远 不 要 停止 扩充 
知识 的 脚步 。 

祝 你 阅读 愉快 ! 


本 书包 含 的 内 容 


第 1 章 介绍 如 何在 Linux、Windows 或 Mac 上 安装 Clang /LLVM 软件 包 ， 包 括 有 关 
在 Visual Studio 和 Xcode 上 构建 LLVM 的 讨论 。 本 章 还 将 介绍 LLVM 不 同 发 行 版 的 风格 ， 
以 便于 你 根据 自身 需要 选择 最 合适 的 发 行 版 本 : 预 构建 的 二 进 制 文件 、 软 件 分 发 包 或 源 
代码 。 

第 2 章 介 绍 包含 于 单独 的 软件 包 或 仓库 中 的 外 部 LLVM 项 目 ， 例 如 额外 的 Clang 工具 、 
DragonEgg GCC 插件 、LLVM 调试 器 (LLDB) 和 LLVM 测试 套件 。 

第 3 章 解释 LLVM 项 目 中 不 同 工 具 的 组 织 形 式 ， 并 通过 一 个 实例 介绍 如 何 使 用 它们 将 
源 代码 编译 成 汇编 语言 。 本 章 还 将 介绍 编译 器 驱动 程序 的 工作 原理 ， 以 及 如 何 编写 你 的 第 一 


VIII 


个 LLVM 工具 。 

第 4 章 介 绍 LLVM 编译 器 前 端 ， 即 Clang 项 目 。 本 章 将 一 步 一 步 地 完整 呈现 前 端 涉及 
的 所 有 步骤 ， 同 时 还 将 解释 如 何 编 写 调用 前 端 不 同 功能 的 小 程序 。 本 章 最 后 介绍 如 何 使 用 
Clang 库 编 写 一 个 小 型 编译 器 驱动 程序 。 

第 5 章 解 释 LLVM 设计 中 的 一 个 关键 部 分 ， 即 其 中 间 表 示 ( IR)。 本 章 将 解释 它 的 重要 
特点 、 语 法 、 结 构 以 及 如 何 编写 生成 LLVM IR 的 工具 。 

第 6 章 介 绍 LLVM 的 编译 器 后 端 ， 它 负责 将 LLVM IR 转换 为 机 器 代码 。 本 章 将 逐步 介 
绍 后 端 涉 及 的 所 有 步 又， 并 介绍 编写 自己 的 LLVM 后 端 所 需 的 知识 。 本 章 最 后 展示 如 何 创 
建 一 个 后 端 编译 流程 。 

第 7 章 解 释 LLVM 即时 编译 基础 架构 ， 它 允许 按 需 生成 和 执行 机 器 代码 。 对 于 仅 在 
运行 时 才 知 道 源 程序 代码 的 应 用 程序 来 说 ， 此 技术 至 关 重 要 ， 例 如 Internet 浏览 器 中 的 
JavaScript 解释 器 。 本 章 将 指导 你 使 用 正确 的 库 来 创建 自己 的 JIT 编译 器 。 

第 8 章 介绍 如 何 使 用 Clang / LLVM 在 其 他 平台 (如 基于 ARM 的 平台 ) 下 编译 程序 。 由 
于 程序 的 最 终 运行 平台 和 编译 平台 是 不 同 的 ， 其 中 的 关键 步骤 在 于 配置 正确 的 编译 环境 。 

第 9 章 介 绍 一 个 功能 强大 的 工具 ， 该 工具 甚至 无 须 运行 程序 ， 直 接 通过 分 析 代 码 ， 即 可 
查找 大 型 源 代码 库 中 的 错误 。 本 章 还 将 介绍 如 何 使 用 你 自己 的 错误 检查 程序 扩展 Clang 静态 
分 析 器 。 

第 10 章 介绍 LibTooling 框架 和 一 系列 基于 此 库 构建 的 Clang 工具 ， 这 些 工 具 可 以 帮助 
你 方便 地 重 构 源 代码 或 者 进行 简单 的 分 析 。 本 章 最 后 将 展示 如 何 使 用 该 框架 编写 自己 的 C++ 
源 代码 重 构 工 具 。 

在 撰写 本 书 时 ，LLVM 3.5 尚未 发 布 。 虽 然 本 书 侧重 于 LLVM 3.4 版 本 ， 但 我 们 计划 
发 布 附 录 将 书 中 的 示例 更 新 为 LLVM 3.5， 这 样 你 就 可 以 使 用 最 新 版 本 的 LLYM 来 练习 本 
书 的 内 容 。 该 附录 将 通过 https://www.packtpub.com/sites/default/files/downloads/6924OS_ 
Appendix.pdf 提供 。 


阅读 本 书 需要 的 前 提 


要 开始 探索 LLVM 世界 ， 可 以 使 用 UNIX 系统 、Mac OS X 系统 或 Windows 系统 ， 只 
要 它们 配备 现代 C++ 编译 器 即 可 。LLVM 源 代码 对 所 用 的 C++ 编译 器 要 求 很 高 ， 因 此 我 们 
建议 读者 总 是 使 用 最 新 的 C++ 版 本 。 这 意味 着 在 Linux 上 至 少 需要 GCC 4.8.1, 在 Max OS 
X 上 至 少 需要 Xcode 5.1， 在 Windows 上 需要 Visual Studio 2012。 

尽管 我 们 会 解释 如 何 使 用 Visual Studio 在 Windows 上 构建 LLVM， 但 该 平台 并 不 是 本 
书 的 重点 ， 因 为 某 些 LLVM 功能 在 该 平台 上 无 法 使 用 。 例 如 ，LLVM 在 Windows 上 人 缺少 可 
加 载 模块 支持 ， 但 是 我 们 要 介绍 的 内 容 包 括 如 何 编写 作为 共享 库 构 建 的 LLVM 插件 。 在 这 
种 情况 下 ， 支 持 该 内 容 的 唯一 方法 是 使 用 Linux 或 Mac OS X。 

如 果 读 者 不 想 自 己 构建 LLVM， 可 以 使 用 预 构建 的 二 进 制 包 ， 但 是 这 也 限制 了 读者 能 够 
使 用 的 平台 范围 。 


本 书目 标 读者 
本 书面 向 有 兴趣 了 解 LLVM 框架 的 编程 爱好 者 、 计 算 机 科学 专业 学 生 和 编译 器 工程 师 。 


你 需要 有 C++ 背景 知识 ， 尽 管 不 是 强制 性 的 ， 但 至 少 应 该 了 解 一 些 编译 器 理论 。 无 论 你 是 
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构建 和 安装 LLVM 





LLVYVM 基 础 架构 适用 于 多 种 Unix 环 境 (GNU/Linux、FreeBSD、Mac OS X) 和 
Windows 环境 。 在 本 章 中 ,我 们 将 逐步 介绍 在 所 有 这 些 系 统 中 使 用 LLVM 之 前 的 必要 准 
备 步 又。 在 部 分 系统 上 有 相应 的 LLVM 和 Clang 预 构建 软件 包 ， 但 也 可 以 从 源 代码 编译 
它们 。 

LLVM 初学 者 必须 考虑 以 下 情况 : 基于 LLVM 编译 器 的 基本 设置 均 包 括 LLVM 和 Clang 
库 及 工具 包 。 因 此 ， 本 章 中 的 所 有 操作 说 明 均 针对 构建 和 安装 两 个 方面 。 在 本 书 中 ， 我 们 将 
重点 介绍 LLVM 3.4 版 本 。 然 而 ， 需 要 注意 的 是 , LLVM 正在 积极 发 展 ， 是 一 个 年 轻 的 项 目 ， 
因此 ， 它 很 可 能 会 有 一 些 变更 。 


计划 在 https://www.packtpub.com/sites/default/files/downloads/ 
69240S_Appendix.pdf 上 发 布 一 个 附录 ,将 本 书 中 的 示例 更 新 到 LLVM 3.5 
版 本 ， 以 便于 你 使 用 最 新 版 本 的 LLVM 来 执行 本 书 的 内 容 。 


总 在 撰写 本 书 时 ，LLVM 3.5 尚未 发 布 。 虽 然 本 书 的 描述 着 重 于 LLVM 3.4， 但 我 们 


本 章 将 介绍 以 下 主题 : 

。 了 解 LLVM 版 本 

e 使 用 预 构建 的 二 进 制 文件 安装 LLVM 

e 使 用 包 管理 器 安装 LLVM 

e 从 源 代码 构建 用 于 Linux 的 LLVM 

e 从 源 代码 构建 用 于 Windows 和 Visual Studio 的 LLVM 
e@ 从 源 代码 构建 用 于 Mac OS X 和 Xcode 的 LLVM 


1.1 了 解 LLVM 版 本 


得 益 于 许多 程序 员 的 贡献 ，LLVM 项 目 得 以 快速 更 新 。 从 10 年 前 的 第 一 次 发 布 到 版 本 
3.4， 其 SVN ( 即 Subversion， 这 是 一 个 用 于 开源 代码 的 版 本 控制 系统 ) 存储 库 包 含 了 超过 
20 万 次 提交 。 仅 在 2013 年 ， 该 项 目 就 有 近 3 万 次 新 的 提交 。 因 此 ， 新 功能 不 断 被 引入 ， 有 
些 功能 也 迅速 被 淘汰 。 正 如 任何 大 型 项 目 一 样 ， 开 发 人 员 有 着 较 短 的 开发 周期 ， 需 要 在 项 目 
运行 良好 并 通过 各 种 测试 时 发 布 稳定 的 检查 点 ， 从 而 允许 用 户 在 使 用 经 过 良好 测试 的 版 本 的 
同时 ,体验 最 新 的 功能 。 

LLVM 项 目 在 整个 发 展 历史 上 采用 了 每 年 发 布 两 个 稳定 版 本 的 策略 。 每 次 更 新 都 将 次 要 
版 本 号 增加 1。 例 如 ， 从 版 本 3.3 到 版 本 3.4 的 更 新 是 次 要 版 本 更 新 。 一 旦 次 要 号 码 达 到 9， 
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下 一 个 版 本 会 将 主 版 本 号 增加 1， 就 像 LLVM 2.9 之 后 更 新 的 LLVM 3.0。 与 其 前 任 版 本 相 
比 ， 主 要 修订 版 本 的 更 新 不 一 定 会 产生 很 大 的 变化 。 但 与 上 一 个 主要 版 本 相 比 ， 这 个 主要 版 
本 的 更 新 一 般 代 表 近 5 年 来 编译 器 的 发 展 过 程 。 

依赖 于 LLVM 的 项 目 通常 使 用 其 trunk (主干 ) 版 本 ， 即 SVN 存储 库 中 最 新 可 用 的 版 本 ， 
然而 使 用 这 个 版 本 的 代价 在 于 这 个 版 本 可 能 不 稳定 。 最 近 ， 从 版 本 3.4 开始 ，LLVM 社区 致 
力 于 修正 发 布 ， 引 入 新 的 修订 版 本 号 。 这 项 工作 的 第 一 个 产品 是 LLVM 3.4.1。 修 正 发 布 的 
目的 是 将 主干 分 支 修复 的 补丁 包 不 添加 任何 新 特性 地 移植 到 最 新 版 本 ， 从 而 保持 完整 的 兼容 
性 。 修 正 发 布 应 该 出 现在 上 一 次 发 布 的 3 个 月 之 后 。 由 于 这 个 新 系统 还 处 于 起 步 阶段 ， 本 章 
将 重点 介绍 LLVM 3.4 的 安装 。LLVM 3.4 的 预 构 建 软件 包 数 量 较 大 ， 但 只 要 遵循 我 们 的 操 
作 说 明 ， 就 应 该 能 够 顺利 地 构建 LLVM 3.4.1 或 任何 其 他 版 本 。 


1.2 获取 预 构建 包 


为 了 使 在 你 的 系统 上 安装 软件 的 任务 变 得 容易 ，LLVM 贡献 者 为 特定 平台 准备 了 预 编 译 
的 二 进 制 文件 ， 你 可 以 不 用 自己 编译 。 在 某 些 情况 下 ， 编 译 一 个 软件 可 能 很 棘手 ， 它 可 能 需 
要 一 些 时 间 ， 并 且 只 有 你 在 使 用 不 同 的 平台 或 积极 地 从 事项 目 开 发 工作 时 才 需 要 。 因 此 ， 如 
果 你 想 要 快速 入 门 LLVM， 可 以 使 用 预 构建 软件 包 。 但 是 在 本 书 中 ， 我 们 将 鼓励 你 直接 从 
LLVM 源 代 码 树 入 手 ， 你 应 该 准备 好 自己 从 源 代 码 树 编 译 LLVM。 

获取 LLVM 的 预 构建 包 的 方法 有 两 种 : 可 以 通过 官方 网 站 获取 已 发 布 的 二 进 制 文件 的 
软件 包 ， 也 可 以 从 第 三 方 GNU/Linux 发 行 版 和 Windows 安装 程序 获取 。 


1.2.1 获取 官方 预 构建 二 进 制 文 件 
对 于 版 本 3.4， 可 从 LLVM 官网 下 载 针 对 以 下 系统 的 预 构建 软件 包 : 


体系 结构 版 本 
x86 84 Ubuntu ( 12.04,13.10 )、Fedora 19、Fedora 20、FreeBSD 9.2、Mac OS X 10.9、Windows 和 
openSUSE 13.1 
1386 openSUSE 13.1 、FreeBSD 9.2、Fedora 19、Fedora 20 和 openSUSE13.1 


ARMv7/ARMv7a &~ Linux-generic 

通过 访问 http://www.llvm.org/releases/download.html， 并 查看 与 想 要 下 载 
的 版 本 相关 的 “ Pre-built Binaries ”部 分 ， 可 以 查看 不 同 版 本 的 所 有 选项 。 例 如 ， 要 在 Ubuntu 
13.10 上 下 载 并 执行 系统 范围 的 LLVM 安装 ， 需 要 获取 该 文件 的 URL， 并 使 用 以 下 命令 : 


$ sudo mkdir -p /usr/local; cd /usr/local 


$ sudo wget http://llvm.org/releases/3.4/clang+llvm-3.4-x86 64-linux-gnu- 
ubuntu-13.10.tar.xz 


$ sudo tar xvf clang+llvm-3.4-x86 64-linux-gnu-ubuntu-13.10.tar.xz 
$ sudo mv clang+llvm-3.4-x86 64-linux-gnu-ubuntu-13.10 llvm-3.4 
$ export PATH="$PATH: /usr/local/llvm-3.4/bin" 


至 此 ，LLVM 和 Clang 就 可 以 使 用 了 。 请 记 住 ， 你 需要 永久 地 更 新 系统 的 PATH 环境 变 
量 ， 因 为 我 们 在 最 后 一 行 所 做 的 更 新 仅 对 当前 shell 会 话 有 效 。 你 可 以 使 用 简单 的 命令 执行 
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Clang 来 测试 安装 是 否 成 功 ， 比 如 打印 你 刚刚 安装 的 Clang 版 本 : 


$ clang -Vv 


如 果 在 运行 Clang 时 遇 到 问题 ， 请 尝试 直接 从 安装 位 置 运行 二 进 制 代码 ， 以 确保 你 没有 
遇 到 PATH 变量 错误 配置 的 问题 。 如 果 问 题 还 没有 解决 ， 则 你 下 载 的 预 构建 文件 可 能 与 你 的 
系统 环境 不 兼容 。 请 记 住 ， 在 编译 时 二 进 制 文件 需要 与 特定 版 本 的 动态 库 链 接 。 如 果 运 行 应 
用 程序 时 出 现 链接 错误 ， 就 说 明 你 下 载 的 预 构建 二 进 制 文件 与 系统 不 兼容 。 


< 例如， 在 Linux 中 ， 在 出 现 错误 信息 之 后 ， 可 以 通过 打印 二 进 制 文件 名 称 和 无 法 
加 载 的 动态 库 的 名 称 来 发 现 链接 错误 。 当 屏幕 上 打印 动态 库 名 称 时 就 要 予以 注意 ， 
它 说 明 系统 动态 链接 器 和 加 载 器 无 法 加 载 该 库 ， 因 为 该 程序 与 当前 系统 不 兼容 。 


如 果 要 在 除 Windows 以 外 的 其 他 系统 中 安装 预 构建 的 软件 包 ， 可 以 遵循 相同 的 步 
又 。 针 对 Windows 的 预 构建 软件 包 提 供 了 一 个 易于 使 用 的 安装 程序 ， 它 可 以 在 Program 
' Files 文件 夹 的 子 文件 夹 中 建立 LLVM 树 结构 。 安 装 程序 还 提供 了 自动 更 新 PATH 环境 变 
量 的 选项 ,使 你 能 在 任何 命令 提示 符 窗口 中 运行 Clang 可 执行 文件 。 


1.2.2 ”使 用 软件 包 管理 器 


软件 包 管理 器 应 用 程序 可 用 于 各 种 系统 ， 也 是 获取 和 安装 LLYM/Clang 二 进 制 文件 的 简 
单方 法 。 对 于 大 多 数 用 户 来 说 ， 这 通常 是 安装 LLVM 和 Clang 的 首选 方法 ， 因 为 它 会 自动 
处 理 依赖 关系 的 问题 ， 并 确保 你 的 系统 与 所 安装 的 二 进 制 文件 兼容 。 

例如 ， 在 Ubuntu ( 10.04 及 更 高 版 本 ) 中 ， 应 该 使 用 以 下 命令 : 


$ sudo apt-get install llvm clang 
在 Fedora 18 中 ， 使 用 类 似 的 命令 行 ， 但 包 管理 器 不 同 : 


$ sudo yum install llvm clang 


使 用 快照 包 更 新 

也 可 以 从 每 日 构建 的 源 代码 快照 构建 软件 包 ， 这 类 快照 包含 来 自 LLVM 子 版 本 控制 库 
的 最 新 修改 ( commit)。 这 些 快照 很 有 用， 尤其 是 对 于 LLVM 开发 人 员 和 希望 测试 早期 版 本 
的 用 户 ， 以 及 希望 以 主流 开发 成 果 使 本 地 项 目 保持 最 新 的 第 三 方 用 户 。 

Linux | 

通过 Debian 和 Ubuntu Linux (i386 和 amd64 ) 软件 库 ， 可 以 从 LLVM 版 本 控制 库 中 下 
载 每 日 编译 的 快照 。 你 可 以 在 http://1lvm.org/apt 查看 更 多 详细 信息 。 例 如 ， 要 在 
Ubuntu 13.10 上 安装 LLVM 和 Clang 的 每 日 发 行 版 ， 请 使 用 以 下 命令 序列 : 


$ sudo echo "deb http://llvm.org/apt/raring/ llvm-toolchain-raring main" 
>> /etc/apt/sources.list 

$ wget -0 - http://llvm.org/apt/llvm-snapshot.gpg.key | sudo apt-key add - 
$ sudo apt-get update 

$ sudo apt-get install clang-3.5 llvm-3.5 


4 劳 1 草 


Windows 

特定 LLVMVClang 快照 的 Windows 安装 程序 可 从 http://llvm.org/builds/ 的 
“Windows snapshot builds” 部 分 下 载 。 最 终 的 LLVM/Clang 工具 默认 安装 于 C:\ 
ProgramFiles\LLVM\bin (该 位 置 可 能 会 根据 发 行 版 本 而 有 所 变化 )。 请 注意 ， 有 一 个 
单独 的 Clang 驱动 程序 可 模仿 Visual C++ 中 的 cl.exe， 名 为 clang-cl.exe。 如 果 你 打 
算 使 用 经 典 的 GCC 兼容 驱动 程序 ， 请 使 用 clang .exe。 


Waste 


1.3 从 源 代码 构建 


在 没有 预 构建 的 二 进 制 文件 的 情况 下 ， 可 以 先 获 取 源 代码 ， 然 后 从 头 构建 LLVM 和 
Clang。 从 源 代 码 构建 能 够 更 好 地 了 解 LLVM 结构 。 此 外 ， 你 可 以 微调 配置 参数 ， 以 获取 定 
制 的 编译 器 。 


1.3.1 系统 要 求 


若 要 查看 支持 LLVM 的 平台 的 更 新 列表 ， 可 以 访问 http://1llvm.org/docs/ 
GettingStarted.html#hardware。 另 外 , http://llvm.org/docs/Gettingstarted. 
html#software 列 出 了 一 系列 更 新 的 编译 LLVM 软件 的 先决 条 件 。 例 如 ， 在 Ubuntu 系统 
中 ， 可 以 使 用 以 下 命令 解决 软件 依赖 关系 : 


$ sudo apt-get install build-essential zliblg-dev python 


如 果 正 在 使 用 包含 过 时 软件 包 的 旧版 Linux 发 行 版 ， 请 尽量 更 新 系统 。LLVM 源 代 码 对 
用 于 执行 构建 的 C++ 编译 器 非常 苛刻 ， 如 果 依 赖 旧 的 C++ 编译 器 ， 可 能 导致 构建 失败 。 


1.3.2 获取 源 代 码 

LLVM 源 代 码 以 BSD 风格 的 许可 证 进行 分 发 ， 可 以 从 官网 或 SVN 存储 库 中 下 载 。 如 
果 要 下 载 3.4 版 本 的 源 代 码 ， 可 以 访问 网 站 http://llvm.org/releases/download. 
html#3.4， 或 按 如 下 步骤 直接 下 载 并 准备 用 于 编译 的 源 代码 。 请 注意 ， 你 总 是 需要 Clang 
和 LLVM， 但 是 clang-tools-extra 包 是 可 选 的 。 不 过 如 果 你 打算 练习 在 第 10 章 中 的 教程 ， 那 
么 你 将 需要 使 用 该 包 。 有 关 构 建 其 他 项 目的 信息 ， 请 参阅 下 一 章 。 请 使 用 以 下 命令 下 载 并 安 
装 LLVM 、Clang 和 Clang Extra Tools: 


$ wget http://llvm.org/releases/3.4/llvm-3.4.src.tar.gz 

$ wget http://llvm.org/releases/3.4/clang-3.4.src.tar.gz 

$ wget http://llvm.org/releases/3.4/clang-tools-extra-3.4.src.tar.gz 
$ tar xzf llvm-3.4.src.tar.gz; tar xzf clang-3.4.src.tar.gz 


$ tar xzf clang-tools-extra-3.4.src.tar.gz 
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$ mv llvm-3.4 llvm 
$ mv clang-3.4 llvm/tools/clang 


$ mv clang-tools-extra-3.4 llvm/tools/clang/tools/extra 


在 Windows 中 ， 可 以 使 用 gunzip、WinZip 或 任何 其 他 可 用 的 解压 缩 工具 解压 下 


1.3.2.1 SVN 
要 直接 从 SVN 存储 库 中 获取 源 代码 ， 请 确保 你 的 系统 上 安装 了 SVN 软件 包 。 下 一 步 ， 
你 需要 决定 是 使 用 存储 库 中 的 最 新 版 本 ， 还 是 稳定 版 本 。 如 果 想 要 最 新 版 本 (在 trunk 中 )， 
假设 你 已 进入 想 要 放置 源 代码 的 目标 文件 夹 中 ， 则 可 以 使 用 以 下 命令 序列 : 
0 http://llvm.org/svn/llvm-project/llvm/trunk 11vm 


cd llvm/tools 
svn co http://llvm.org/svn/llvm-project/cfe/trunk clang 


svn co http://llvm.org/svn/llvm-project/compiler-rt/trunk compiler-rt 


$ 

$ 

$ 

$ cd ../projects 
$ 

$ cd ../tools/clang/tools 
$ 


svn co http://llvm.org/svn/llvm-project/clang-tools-extra/trunk extra 


如 果 要 使 用 稳定 版 本 (例如 版 本 3.4)， 请 在 所 有 命令 中 将 trunk/ 替换 为 tags/ 
RELEASE_34/final。 你 可 能 还 希望 轻松 地 浏览 LLVM SVN 存储 库 ， 以 查看 提交 历史 记 
录 、 日 志和 源码 树 ， 要 这 样 做 ,可 以 访问 http://llvm.org/viewvc。 

1:3.2.2 Git 

你 还 可 以 从 与 SVN 同步 的 Git 镜像 存储 库 中 获取 源 代码 : 
git clone http://llvm.org/git/llvm.git 
cd llvm/tools 
git clone http://llvm.org/git/clang.git 
cd ../projects 
git clone http://llvm.org/git/compiler-rt.git 
cd ../tools/clang/tools 


ww WW WW WW 


git clone http://llvm.org/git/clang-tools-extra.git 


1.3.3 ”构建 和 安装 LLVM 


下 面 将 解释 构建 和 安装 LLVM 的 各 种 方法 。 

1.3.3.1 使 用 由 自动 工具 生成 的 配置 脚本 

构建 LLVM 的 标准 方法 是 使 用 通过 GNU 自动 工具 创建 的 配置 脚本 ， 来 生成 针对 特定 平 
台 的 Makefile 文件 。 该 构建 系统 支持 不 同 的 配置 选项 ， 被 广泛 采用 。 


ee LLVM 构建 系统 时 ， 才 需要 在 计算 机 上 安装 GNU 自动 工具 。 
一 在 这 种 情况 下 ， 将 生成 一 个 新 的 配置 脚本 ， 通 常 没有 必要 这 样 做 。 
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请 花 点 时 间 使 用 以 下 命令 看 一 看 可 能 的 选项 : 
$ cd llvm 
$ ./configure --help 


部 分 解释 如 下 : 
e --enable-optimized : 此 选项 允许 我 们 在 关闭 调试 支持 和 局 用 优化 的 情况 下 编 
译 LLVMVClang。 默 认 情 况 下 ， 此 选项 已 关闭 。 如 果 你 使 用 LLVM 库 进 行 开 发 ， 则 
建议 使 用 调试 支持 并 禁用 优化 ， 但 是 ， 由 于 缺少 优化 会 使 LLVM 性 能 明显 下 降 ， 因 
此 应 该 在 部 署 时 舍弃 这 种 配置 。 
--enable-assertions: 此 选项 在 代码 中 启用 断言 。 在 开发 LLVM 核心 库 时 ， 此 
选项 非常 有 用 。 默 认 情 况 下 打开 。 
--enable-shared : 此 选项 允许 我 们 将 LLYM/Clang 库 构 建 为 共享 库 ， 并 将 
LLVM 工具 与 它们 进行 链接 。 如 果 打 算 在 LLVM 构建 系统 之 外 开发 一 个 工具 ， 并 和 希 
望 动 态 链接 到 LLVM 库 ， 那 么 应 该 将 其 打开 。 此 选项 默认 情况 下 关闭 。 
--enable-jit: 此 选项 为 支持 它 的 所 有 目标 启用 即时 编译 。 默 认 情况 下 打开 。 
--prefix : 此 选项 指定 LLVMVClang 工具 和 库 的 安装 目录 的 路 径 。 例 如 ， 如 果 设 置 
为 --prefix =/usr/local/1llvm, 将 在 /usr/local/1lvm/bin 中 安装 二 进 
制 文件 ， 并 在 /usr/local/1lvm/1ib 中 安装 库 文件 。 
--enable-targets : 此 选项 允许 我 们 选择 编译 器 输出 代码 的 目标 集 。 值 得 一 提 的 
是 ，LLVM 能 够 执行 交叉 编译 ， 也 就 是 可 以 编译 在 其 他 平台 (如 ARM、MIPS 等 ) 上 
运行 的 程序 。 此 选项 定义 要 在 代码 生成 库 中 包含 哪些 后 端 。 默 认 情况 下 ， 所 有 目标 
都 会 被 编译 ， 但 你 可 以 通过 指定 你 需要 的 目标 来 节省 编译 时 间 。 
SR。 仅 此 选项 还 无 法 生成 独立 的 交叉 编译 器 。 请 参阅 第 8 章 以 了 解 生 成 独立 交叉 编译 
器 的 必要 步骤 。 

在 使 用 相应 参数 运行 configure 后 ， 还 需要 使 用 经 典 的 make 和 make install 两 个 
命令 完成 构建 。 接 下 来 我 们 给 你 展示 一 个 例子 。 

使 用 Unix 构建 和 配置 LLVM 

在 这 个 例子 中 ， 我们 将 使 用 一 系列 命令 构建 一 个 未 优化 ( 即 调试 模式 下 ) 的 LLVM/ 
Clang， 该 方法 适合 于 任何 基于 Unix 的 系统 或 Cygwin。 不 同 于 之 前 的 例子 中 那样 安装 在 
/usr/1local/1llvm 目录 下 ， 我 们 将 在 主 目录 下 构建 并 安装 它 ， 以 解释 如 何在 没有 root 权 
限 的 情况 下 安装 LLVM。 这 是 作为 开发 人 员工 作 时 的 惯例 。 这 样 ， 你 还 可 以 维护 已 安装 的 多 
个 版 本 。 如 果 需 要 ， 可 以 将 安装 文件 夹 更 改 为 /usr/1local/11vm， 从 而 进行 系统 范围 的 
安装 。 只 需 记 住 在 创建 安装 目录 时 使 用 sudo， 并 运行 make install 命令 。 要 使 用 的 命 
令 序 列 如 下 : 


$ mkdir where-you-want-to-install 


$ mkdir where-you-want-to-build 
$ cd where-you-want-to-build 
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在 本 节 中 ， 我们 将 创建 一 个 单独 的 目录 来 保存 对 象 文件 ( 即 中 间 构 建 副 产品 )， 不 要 将 
它 构建 在 用 于 保存 源 文件 的 同一 文件 夹 中 。 请 使 用 以 下 命令 及 上 一 节 中 介绍 过 的 选项 : 


$ /PATH TO SOURCE/configure --disable-optimized --prefix=../where-you- 
want-to-install 


$ make && make install 


< 、 可 以 选择 使 用 make -jN 来 允许 最 多 NN 个 编译 器 实例 并 行 工作 ， 以 加 快 构建 过 
程 。 例如， 如 果 处 理 器 有 四 个 内 核 ， 则 可 以 尝试 使 用 make -j4 (或 稍 大 一 些 的 
数字 )。 


编译 和 安装 所 有 组 件 需 要 一 些 时 间 。 请 注意 ,构建 脚本 还 将 处 理 你 下 载 并 放 入 LLVM 
源 代码 树 的 其 他 存储 库 。 没 有 必要 单独 配置 Clang 或 Clang 其 他 工具 。 

要 检查 构建 是 否 成 功 ， 可 以 使 用 echo $? shell 命令 。$? shell 变量 返回 在 shell 会 话 中 
运行 的 最 后 一 个 进程 的 退出 代码 ， 而 echo 命令 将 其 打印 到 屏幕 。 因 此 ， 在 make 命令 之 后 
要 立即 运行 此 命令 ， 这 一 点 很 重要 。 如 果 构 建成 功 ， 则 make 命令 将 始终 返回 0， 与 成 功 执 
行 完 毕 的 任何 其 他 程序 一 样 : 

$ echo $? 

0 

你 可 以 配置 shell 的 PATH 环境 变量 ， 以 便 轻 松 访问 最 近 安装 的 二 进 制 文件 ， 并 通过 查 
询 Clang 版 本 进行 首次 测试 : 

$ export PATH="$PATH:where-you-want-to-install/bin" 

$ clang -Vv 

clang version 3.4 

1.3.3.2 使 用 CMake 和 Ninja 

除了 传统 的 配置 脚本 以 外 ， 还 可 以 为 LLVM 选择 另 一 种 基于 CMake 的 跨 平台 构建 
系统 。CMake 可 以 按 与 配置 脚本 相同 的 方式 为 你 的 平台 生成 专门 的 Makefile 文件 ， 而 且 
CMake 更 灵活 ， 还 可 以 为 其 他 系统 (如 Ninja、Xcode 和 Visual Studio) 生成 构建 文件 。 

另 一 方面 , Ninja 是 一 个 小 而 快速 的 构建 系统 ， 可 以 替代 GNU Make 及 其 相关 的 
Makefile 文件 。 如 果 你 对 Ninja 背后 的 动机 和 故事 感 兴趣 ， 请 访问 http://aosabook. 
org/en/posa/ninja.html。 你 可 以 将 CMake 配 置 为 生成 Ninja 构 建文 件 而 不 是 
Makefile 文件 ， 即 你 可 以 选择 是 使 用 CMake 和 GNU Make， 还 是 使 用 CMake 和 Ninja。 

然而 ， 如 果 使 用 后 者 ， 你 可 以 在 更 改 LLYM 源 代码 并 重新 编译 时 感受 到 非常 短 的 周转 
时 间 。 如 果 你 打算 在 LLVM 源 代码 树 中 开发 工具 或 插件 ， 并 依赖 于 LLVM 构建 系统 来 编译 
项 目 ， 则 特别 适合 这 样 做 。 

请 确保 你 已 安装 CMake 和 Ninja。 例 如 ， 在 Ubuntu 系统 中 ， 可 以 使 用 以 下 命令 检验 : 


$ sudo apt-get install cmake ninja-build 


带 有 CMake 的 LLVM 还 提供 了 许多 可 以 定制 构建 的 选项 。 有 关 这 些 选 项 的 完整 列表 ， 
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请 访问 http://1llvm.org/docs/CMake.html。 我 们 先前 已 经 介绍 过 基于 自动 工具 的 
系统 ， 以 下 是 对 应 于 该 系统 配置 集合 的 选项 列表 。 这 些 标志 的 默认 值 与 相应 的 配置 脚本 标志 
的 默认 值 相同 : 

e CMAKE_BUILD_TYPE : 这 是 一 个 字符 串 值 ， 用 于 指定 构建 是 Release 还 是 Debug。 
Release 构建 相当 于 在 配置 脚本 中 使 用 --enable-optimized 标志 ， 而 Debug 
构建 相当 于 使 用 --disable-optimized 标志 。 

CMAKE_ENABLE ASSERTIONS: 这 是 一 个 布尔 值 ， 对 应 于 --enable-assertions 
配置 标志 。 

BUILD_SHARED_LIBS : 这 是 一 个 布尔 值 ， 对 应 于 -enable-shared 配置 标志 ， 
用 于 确定 库 是 共享 还 是 静态 。Windows 平台 不 支持 共享 库 。 

e CMAKE_INSTALL PREFIX : 这 是 一 个 字符 串 值 ， 对 应 于 --prefix 配置 标志 ， 用 
于 提供 安装 路 径 。 

LLVM_TARGETS_TO_BUILD : 这 是 要 构建 的 目标 的 列表 ， 以 分 号 分 隔 ， 大 致 对 应 
于 --enable-targets 配置 标志 中 使 用 的 逗号 分 隔 的 目标 列表 。 

要 设置 任何 这 些 参数 值 对 ， 请 将 -DPARAMETER=value 参数 标志 提供 给 cmake 
命令 。 

使 用 CMake 和 Ninja 为 Unix 构建 

我 们 将 重复 前 面 使 用 配置 脚本 时 的 相同 示例 ， 但 这 次 使 用 CMake 和 Ninja 来 构建 它 : 

首先 ， 创 建 一 个 目录 来 包含 构建 及 安装 文件 : 


$ mkdir where-you-want-to-build 


$ mkdir where-you-want-to-install 
$ cd where-you-want-to-build 


请 记 住 ， 这 个 文件 夹 不 能 是 存放 LLVM 源 文件 的 同一 个 文件 夹 。 然 后 ， 用 你 选择 的 一 
组 选项 启动 CMake: 


$ cmake /PATHTOSOURCE -G Ninja -DCMAKE BUILD TYPE="Debug" -DCMAKE 
INSTALL PREFIX="../where-you-want-to-install" 


应 当 将 /PATHTOSOURCE 替换 为 你 的 LLYM 源 文 件 夹 的 绝对 路 径 。 如 果 想 使 用 传统 的 
GNU Make 文件 ， 可 以 忽略 -G Ninja 参数 。 现 在 , 使 用 ninja 或 make (具体 取决 于 你 
的 选择 ) 完成 构建 。 对 于 ninja， 使 用 以 下 命令 : 


$ ninja && ninja install 
对 于 make， 使 用 以 下 命令 : 


$ make && make install 


与 前 面 一 样 ， 可 以 通过 简单 的 命令 来 检查 构建 是 否 成 功 。 记 住 ， 一定 要 在 最 后 一 条 构建 
命令 之 后 立即 使 用 它 ， 因 为 它 会 返回 在 当前 shell 会 话 中 运行 的 最 后 一 个 程序 的 退出 值 : 
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$ echo 5$? 
0 


如 果 上 面 的 命令 返回 零 ， 则 操作 成 功 。 最 后 ， 请 配置 你 的 PATH 环境 变量 ， 并 使 用 你 的 
新 编译 器 : 

$ _ export PATH=$PATH:where-you-want-to-install/bin 

$ clang -v 

解决 构建 错误 

如 果 构 建 命 令 返 回 非 零 值 ， 则 表示 发 生 错 误 。 在 这 种 情况 下 ，Make 或 Ninja 会 打印 错 
误 , 使 其 对 你 可 见 。 请 重点 关注 提示 的 第 一 个 错误 ， 以 找到 解决 方案 。 对 于 稳定 的 LLYM 
版 本 ， 和 常见 的 错误 是 你 的 系统 使 用 了 不 满足 版 本 要 求 的 软件 。 最 常见 的 问题 是 使 用 过 时 的 编 
译 器 。 例 如 ， 使 用 GNU g ++ 版 本 4.4.3 构建 LLVM 3.4 时， 在 成 功 编译 一 半 以 上 的 LLVM 
源 文 件 之 后 ， 将 导致 以 下 编译 错误 : 


[1385/2218] Building CXX object projects/compiler-rt/lib/interception/ 
CMakeFiles/RTInterception.i386.dir/interception type test.cc.o 


FAILED: /usr/bin/c++ (...) test.cc.o -c /local/llvm-3.3/llvm/projects/ 
compiler-rt/lib/interception/interception type test.cc 


test.cc:28: error: reference to 'OFF64 T' is ambiguous 


interception.h:31: error: candidates are: typedef sanitizer::OFF64 T 
OFF64 T 


sanitizer internal defs.h:80: error: typedef 
sanitizer::u64 sanitizer::OFF64 T 


你 可 以 更 改 LLVM 源 代码 来 规避 这 个 问题 (如 果 你 在 线 搜索 或 者 自己 查看 源码 ， 将 会 发 
现 如 何 执行 此 操作 )， 但 是 ， 无 法 修补 每 个 想 要 编译 的 LLVM 版 本 。 更 新 编译 器 要 简单 得 多 ， 
当然 也 是 最 合适 的 解决 方案 。 

一 般 来 说 ， 在 稳定 版 本 中 遇 到 构建 错误 时 ， 请 注意 你 的 系统 与 推荐 设置 相 比 有 什么 区 

别 。 请 记 住 ， 稳 定 版 本 已 经 在 几 个 平台 上 进行 了 测试 。 另 一 方面 ， 如 果 你 正在 尝试 构建 一 个 

不 稳定 的 SVN 版 本 ， 则 最 近 的 提交 可 能 会 影响 针对 你 的 系统 的 构建 ， 因 此 恢复 到 之 前 可 用 
的 SVN 版 本 更 为 简便 。 

1.3.3.3 使 用 其 他 Unix 方法 

一 些 Unix 系统 提供 的 软件 包 管理 器 可 以 从 源 文件 自动 构建 和 安装 应 用 程序 。 它 们 提供 
了 一 个 在 你 的 系统 上 经 过 测试 的 源 代码 编译 平台 ， 并 且 还 尝试 解决 包 依 赖 性 问题 。 我 们 现在 
将 在 构建 和 安装 LLVM 和 Clang 的 环境 中 评估 这 些 平台 : 

e 对 于 使 用 MacPorts 的 Mac OS X， 可 以 使 用 以 下 命令 : 


$ port install llvm-3.4 clang-3.4 
e@ 对 于 使 用 Homebrew 的 Mac OS X， 可 以 使 用 以 下 命令 


$ brew install llvm -with-clang 


e@ 对 于 使 用 ports 的 FreeBSD 9.1， 可 以 使 用 以 下 命令 (请 注意 ， 从 FreeBSD 10 开始 ， 


Clang 是 默认 编译 器 ， 因 此 它 已 经 安装 ): 


cd /usr/ports/devel/llvm34 


$ 

$ make install 

$ cd /usr/ports/lang/clang34 
$ 


make install 
e 对 于 Gentoo Linux， 可 以 使 用 以 下 命令 : 


$ emerge sys-devel/llvm-3.4 sys-devel/clang-3.4 


1.3.4 Windows 和 Microsoft Visual Studio 


要 在 Microsoft Windows 上 编译 LLVM 和 Clang， 可 以 使 用 Microsoft Visual Studio 2012 
和 Windows 8 执行 以 下 步骤 : 

1. 获取 Microsoft Visual Studio 2012。 

2. 从 http://www.cmake.org 下载 并 安装 CMake 工具 的 官方 二 进 制 发 行 版 。 在 安 
装 过 程 中 ， 请 确保 选中 “Add CMake to the system PATH for all users ”选项 。 

3. CMake 将 生成 Visual Studio 配置 和 构建 LLVM 所 需 的 项 目 文件 。 首 先 运行 cmake- 
gui 图 形 工 具 。 然 后 ， 单 击 “ Browse Source…” 按 钮 并 选择 LLVM 源 代码 目录 。 接 下 来 ， 
单 击 “Browse Build” 按 钮 ， 并 选择 一 个 目录 来 放置 CMake 生成 的 文件 (随后 Visual Studio 
将 使 用 它 )， 如 图 1-1 所 示 。 










Where is the source code: [cvm-sources/lvm Source...| 
Where to build the binarles: [C:/Program Files (x86)/LIVM ee Buid... | 
Search: [ Grouped 「 Advanced | 





Press Configure to update and display new values in red, then press Generate to generate selected build files. 


4. 单 击 “ Add Entry” 并 定义 CMAKE_ INSTALL PREFIX 以 包含 LLVM 工具 的 安装 路 


径 ， 如 图 1-2 所 示 。 
5. 此外， 可 以 使 用 LLVM _TARGETS _TO BUILD 定义 支持 的 目标 集 ， 如 图 1-3 所 示 。 
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你 可 以 选择 添加 任何 其 他 条 目 ， 以 定义 我 们 之 前 讨论 过 的 CMake 参数 。 


Name: INSTALL_PREFIX UVM_TARGETS_ TO_BUED 
Type: PATH 了 [STRING -| 


Value: frooram Files Cx86)/LVMinstall -| | [ARM;Mips;XB5 
Description: [PATH to nstall LIVM tools| Description: |Set of targets to build 


Lm |] em | wx ] emm | 





6. 单 击 “ Configure ”按钮 。 会 有 一 个 弹出 窗口 询问 该 项 目 要 使 用 的 生成 器 和 编译 器 ， 
请 选择 “Use default native compilers”， 对 于 Visual Studio 2012 ， 请 选择 “Visual Studio 11” 
选项 。 单 击 “Finish”， 如 图 1-4 所 示 。 


*_ Use default native compilers 


Specify native compilers 


Specify toolchain file for cross-compiling 


Specify options for cross-compiling 





发 对 于 Visual Studio 2013 ， 请 使 用 Visual Studio 12 的 生成 器 。 生 成 器 的 名 称 将 使 用 
Visual Studio 版 本 而 不 是 其 商业 名 称 。 


7. 配置 结束 后 ， 单 击 “ Generate ”按钮 。 然 后 ，Visual Studio 解决 方案 文件 LLVM.s1ln 
会 被 写 入 指定 的 构建 目录 中 。 请 转 到 此 目录 并 双击 此 文件 ， 随 后 将 在 Visual Studio 中 打开 
LLVM 解决 方案 。 

8. 若 要 自动 构建 和 安装 LLYM/Clang， 请 在 左 侧 的 树 状 视图 窗口 中 找到 
“CMakePredefinedTargets”， 再 右键 单 击 “INSTALL ”， 然 后 选择 “Build” 选 项 。 预 定义 的 
INSTALL 目标 将 指示 系统 构建 和 安装 所 有 LLVM/Clang 工具 和 库 ， 如 图 1-5 所 示 。 

9. 要 选择 性 地 构建 和 安装 特定 的 工具 或 库 ， 请 在 左 侧 的 树 列 表 视 图 窗口 中 选择 相应 的 项 
目 ， 再 右键 单 击 该 项 目 ， 然 后 选择 “Build” 选 项 。 

10. 将 LLVM 二 进 制 文件 安装 目录 添加 到 系统 的 PATH 环境 变量 中 。 

在 我 们 的 例子 中 ， 安 装 目 录 是 C:\Program Files(x86)\LLVM\install\bin。 
要 直接 测试 安装 而 不 更 新 PATH 环境 变量 ， 请 在 命令 提示 符 窗口 中 执行 以 下 命令 : 

C:>"C:\Program Files (x86)\LLVM\install\bin\clang.exe" -Vv 


clang version 3.4... 





1.3.5 MacOS X 和 Xcode 


尽管 可 以 通过 使 用 前 面 描述 的 常规 Unix 指令 为 Mac OS X 编译 LLVM， 但 也 可 以 使 用 
Xcode 进行 编译 : 

1. 获取 Xcode 副本 。 

2. 下 载 并 安装 位 于 http://www.cmake.org 的 CMake 工具 的 官方 二 进 制 发 行 版 。 
确保 选中 “Add CMake to the system PATH for all users ”选项 。 

3. CMake 能 够 生成 Xcode 使 用 的 项 目 文件 。 首先 运行 cmake-gui 图 形 化 工具 。 然 
后 ， 如 图 1-6 所 示 ， 单 击 “ Browse Source ”按钮 并 选择 LLVM 源 代 码 目录 。 接 下 来 , 单 
击 “ Browse Build” 按 钮 ， 然 后 选择 一 个 目录 用 于 存放 CMake 生成 的 文件 ， 这 些 文件 将 被 
Xcode 使 用 。 
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4. 单 击 “Add Entry” 并 定义 CMAKE INSTALL PREFIX 以 包含 LLVM 工具 的 安装 路 
径 ， 如 图 1-7 所 示 。 

5. 另外， 可 以 使 用 LLVM _TARGETS TO BUILD 来 定义 支持 的 目标 集 。 可 以 选择 添加 
任何 其 他 条 目 ， 以 定义 我 们 之 前 讨论 的 CMake 参数 ， 如 图 1-8 所 示 。 

6. Xcode 不 支持 生成 LLVM 位置 无 关 代 码 ( PIC) 库 。 单 击 “ Add Entry” 并 添加 
LLVM_ENABLE_PIC 变量 ， 它 是 BOOL 类 型 ， 不 要 选中 复 选 框 ， 如 图 1-9 所 示 。 





图 1-7 图 1-8 


7. 单 击 “ Configure” 按 钮 。 将 弹出 窗口 要 求 你 指定 该 项 目 使 用 的 生成 器 和 编译 器 。 选 
择 “ Use default native compilers ”和 “Xcode”。 点 击 “ Finish ”按钮 结束 进程 ， 如 图 1-10 
所 示 。 





8. 配置 结束 后 ， 单 击 “ Generate ”按钮 ， 然 后 LLVM .xcodeproj 文件 会 被 写 入 之 前 指 
定 的 构建 目录 中 。 转 到 此 目录 并 双击 此 文件 以 便 在 Xcode 中 打开 LLYM 项 目 。 

9. 要 构建 和 安装 LLVM/Clang， 请 选择 “install”， 如 图 1-11 所 示 。 

10. 接 下 来 ， 点 击 “Product” 菜 单 ， 然 后 选择 “Build” 选 项 ， 如 图 1-12 所 示 。 

11. 将 LLYM 二 进 制 文件 安装 目录 添加 到 系统 的 PATH 环境 变量 中 。 

在 我 们 的 示例 中 ， 安 装 二 进 制 文件 的 文件 夹 是 /Users/Bruno/llvm/install/ 
bin。 要 测试 安装 ， 请 使 用 安装 目录 中 的 clang 工具 ， 如 下 所 示 : 


$ /Users/Bruno/llvm/install/bin/clang -Vv 


clang version 3.4... 


C-index-test 
LLVMTransformUtils 
llvm-~ar 
ClangCommentNodes 
ClangAttrList 
ClangDiagnosticCommon 
JIiTTests 

LLVMX86Utils 

ALL_ BUILD 


vy vy Vy YYVYVYVYVYYVYYYYvYYvvvvh 


Run 
Test 
Profile 
Analyze 
Archive 


Build For 
Perform Action 


Stop 
Generate Output 


Debug 
Debug Workflow 
Attach to Process 


Edit Scheme... 
New Scheme... 
Manage Schemes... 





1.4 总 结 


本 章 详细 介绍 如 何 通过 官方 构建 的 软件 包 使 用 预 构建 的 二 进 制 文件 、 第 三 方 软件 包 管 理 
器 和 每 天 的 快照 来 安装 LLVM 和 Clang。 此 外 ， 还 详细 介绍 了 如 何在 不 同 的 操作 系统 环境 中 
使 用 标准 的 Unix 工具 和 IDE 从 源 文件 构建 项 目 。 

在 下 一 章 中 ， 我 们 将 介绍 如 何 安装 LLVM 中 其 他 可 能 对 你 非常 有 用 的 项 目 。 这 些 外 部 
项 目 通常 用 于 实现 在 主 LLVM SVN 存储 库 之 外 开发 并 且 单 独 发 布 的 工具 。 
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外 部 项 目 


不 包含 于 核心 LLVM 和 Clang 存储 库 的 项 目 需要 单独 下 载 。 在 本 章 中 ， 我 们 将 介绍 各 
种 其 他 官方 LLVM 项 目 ， 并 介绍 如 何 构建 和 安装 它们 。 仅 对 核心 LLVM 工具 感 兴趣 的 读者 
可 以 跳 过 本 章 ， 或 在 需要 时 再 翻阅 。 

在 本 章 中 ， 我 们 将 介绍 以 下 项 目 及 其 安装 方法 : 

e Clang 外 部 工具 

e Compiler-RT 

® DragonEgg 

e LLVM 测试 套件 

e LLDB 

® libct+ 

除了 本 章 所 涉及 的 项 目 之 外 ， 还 有 两 个 在 本 书 范围 之 外 的 官方 LLYM 项 目 : Polly (多 
面体 优化 器 ) 以 及 lld (目前 正在 开发 的 LLVM 链接 器 )。 

预 构建 的 二 进 制 包 不 包含 本 章 中 提 及 的 任何 外 部 项 目 (Compiler-RT 除外 )。 因 此 , 与 上 
一 章 不 同 ， 我 们 将 仅 介绍 如 何 下 载 源 代码 并 自行 构建 它们 。 

读者 不 要 指望 本 章 介绍 的 项 目 与 核心 LLVM/VClang 项 目的 成 熟 度 相同 ， 因 为 其 中 一 些 项 
目 只 是 实验 性 的 ， 或 处 于 起 步 阶 段 。 


2.1 Clang 外 部 项 目 介绍 


LLVM 中 最 引 人 注 目的 设计 就 是 将 后 端 与 前 端 隔离 为 两 个 独立 的 项 目 ， 即 LLVM 核心 
和 Clang。LLVM 开始 时 是 以 LLVM 中 间 表 示 ( IR) 为 中 心 的 一 组 工具 ， 并 且 依 赖 于 可 自行 
修改 的 GCC 将 高 级 语言 程序 转换 为 独 有 的 IR 形式 ， 并 存储 在 位 码 (bitcode) 文件 中 。 位 码 
是 一 个 术语 ， 它 模仿 了 Java 字 节 码 的 命名 。Clang 作为 LLVM 团队 专门 设计 的 第 一 个 前 端 ， 
是 LLVM 项 目的 一 个 重要 里 程 碑 ， 它 有 着 与 LLVM 核心 相同 的 代码 质量 、 清 晰 的 文档 和 库 
组 织 结构 。 它 不 仅 可 以 将 C 和 C++ 程序 转换 为 LLVM IR， 还 可 以 作为 灵活 的 编译 器 驱动 程 
序 对 整个 编译 过 程 进行 监督 ， 以 便 尽 可 能 保持 与 GCC 的 兼容 性 。 

我 们 后 面 会 称 Clang 为 前 端 程序 ， 而 不 是 驱动 程序 ， 它 负责 将 C 和 C++ 程序 转换 为 
LLVM IR。Clang 库 的 一 大 亮点 是 可 以 用 于 编写 强大 的 工具 ， 比 如 C++ 代码 重 构 工 具 和 源 代 
码 分 析 工 具 ， 从 而 使 C++ 程序 员 可 以 自由 地 研究 C++ 的 热点 问题 。Clang 预 包装 的 一 些 工 
具 可 以 帮助 你 了 解 如 何 利 用 这 些 库 ， 比 如 : 

e Clang Check : 它 能 够 执行 语法 检查 ， 还 能 应 用 快速 修复 以 解决 常见 问题 ， 还 可 以 转 
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储 任何 程序 的 内 部 Clang 抽象 语法 树 (AST) 表示 。 
e Clang Format : 它 包 含 一 个 工具 和 一 个 LibFormat 库 ， 它 们 不 仅 可 以 缩 进 代码 ， 还 可 
以 将 任何 一 部 分 C++ 代码 格式 化 为 任何 样式 ， 以 符合 LLVM 编码 标准 以 及 Google、 
Chromium 、Mozilla 或 者 WebKit 的 样式 指南 。 
clang-tools-extra 存储 库 是 建立 在 Clang 之 上 的 多 个 应 用 程序 的 集合 ， 它 们 能 够 读 取 大 
型 C 或 C++ 代码 库 ， 并 执行 各 种 代码 重 构 和 分 析 。 我 们 在 下 面 列 出 这 个 包 中 的 一 些 工 具 ， 
但 不 是 全 部 : 
e Clang Modernizer : 它 是 一 个 代码 重 构 工具 ， 用 于 扫描 C++ 代码 并 更 改 旧 样式 的 结 
构 ， 以 符合 较 新 标准 (例如 C++ 11 标准 ) 提出 的 更 现代 的 样式 。 
e Clang Tidy : 它 是 一 个 错误 检查 工具 ， 用 于 检查 违反 LLVM 或 Google 编码 标准 的 常 
见 编程 错误 。 
e Modularize: 它 可 以 帮助 你 识别 适合 组 成 模块 的 C++ 头 文件 ,“ 模 块 ”是 C++ 标准 化 
委员 会 正在 讨论 的 新 概念 (有 关 更 多 信息 ， 请 参阅 第 10 章 )。 
e PPTrace: 它 是 一 个 简单 工具 ， 用 于 跟踪 Clang C++ 预 处理 器 的 活动 。 
有 关 如 何 使 用 这 些 工具 以 及 如 何 构建 自己 的 工具 的 更 多 信息 ， 请 参见 第 10 章 。 


2.1.1 构建 和 安装 Clang 外 部 工具 


可 以 从 http://llvm.org/releases/3.4/clang-tools-extra-3.4.src.tar.gz 
获取 该 项 目的 3.4 版 本 的 官方 快照 。 如 果 想 浏览 所 有 可 用 的 版 本 ， 请 访问 http://1llvm. 
org/releases/download.html。 如 果 想 依靠 LLVM 构建 系统 轻松 编译 这 组 工具 ， 可 
以 与 核心 LLVM 和 Clang 的 源 代 码 一 起 构建 。 为 此 ， 必 须 将 源 代 码 目录 放 和 人 Clang 源 代码 
树 中 ， 如 下 所 示 : 

$ wget http://llvm.org/releases/3.4/clang-tools-extra-3.4.src.tar.gz 


$ tar xzf clang-tools-extra-3.4.src.tar.gz 


$ mv clang-tools-extra-3.4 llvm/tools/clang/tools/extra 


还 可 以 直接 从 官方 的 LLVM SVN 存储 库 获取 资源 : 


$ cd llvm/tools/clang/tools 
$ svn co http://llvm.org/svn/llvm-project/clang-tools-extra/trunk extra 


从 上 一 章 得 知 ， 如 果 要 获取 版 本 3.4 的 稳定 源 代码 ， 可 以 用 tags/RELEASE 34/final 
替换 trunk。 或 者 ， 如 果 你 喜欢 使 用 GIT 版 本 控制 软件 ， 可 以 使 用 以 下 命令 行 下 载 它 : 

$ cd llvm/tools/clang/tools 

$ git clone http://llvm.org/git/clang-tools-extra.git extra 

将 源 代码 放 入 Clang 树 后 ， 必 须 参 照 第 1 章 中 的 编译 操作 说 明 ， 使 用 CMake 或 自动 工 
具 生 成 的 配置 脚本 继续 操作 。 要 测试 安装 是 否 成 功 ， 请 运行 clang-modernize 工具 ， 如 
下 所 示 : 
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$ clang-modernize -version 


clang-modernizer version 3.4 


2.1.2 理解 Compiler-RT 

Compiler-RT (RT 指 运行 时 ) 项 目 用 于 为 硬件 不 支持 的 低级 功能 提供 特定 于 目标 的 支持 。 
例如 , 32 位 目标 通常 缺少 支持 64 位 除法 的 指令 。Compiler-RT 通过 提供 特定 于 目标 并 经 过 优 
化 的 功能 来 解决 这 个 问题 ， 该 功能 在 使 用 32 位 指令 的 同时 实现 了 64 位 除法 。 它 提供 相同 的 
功能 ， 因 此 是 LLVM 项 目 中 libgcc 的 替代 品 。 此 外 ， 它 还 具有 对 地 址 和 内 存 清洗 工具 的 
运行 时 支持 。 你 可 以 从 http://llvm.org/releases/3.4/compiler-rt-3.4.src. 
tar.gz 下载 3.4 版 本 的 Compiler-RT, 或 者 在 http://llvm.org/releases/download. 
html 上 查找 更 多 版 本 。 

它 在 基于 LLVM 的 编译 工具 链 中 是 一 个 关键 组 件 ， 因 此 上 一 章 已 经 介绍 了 如 何 安装 
Compiler-RT。 如 果 你 仍然 没有 这 个 组 件 ， 请 记 住 将 其 源 代码 放 入 LLVM 源 代码 树 中 的 
projects 文件 夹 内 ， 如 以 下 命令 序列 所 示 : 


$ wget http://llvm.org/releases/3.4/compiler-rt-3.4.src.tar.gz. 
$ tar xzf compiler-rt-3.4.src.tar.gz 


$ mv compiler-rt-3.4 llvm/projects/compiler-rt 
如 果 你 愿意 ， 也 可 以 使 用 它 的 SVN 存储 库 : 


$ cd llvm/projects 
$ svn checkout http://llvm.org/svn/llvm-project/compiler-rt/trunk 
compiler-rt 


除了 SVN 存储 库 ， 还 可 以 通过 GIT 镜像 下 载 : 


$ cd llvm/projects 
$ git clone http://llvm.org/git/compiler-rt.git 


CE Compiler-RT 的 其 他 适用 系统 包括 GNU/Linux、Darwin、FreeBSD 和 NetBSD。 
一 它 支 持 的 体系 结构 如 下 : i386、x86 64、PowerPC、SPARC64 和 ARM。 


2.1.3 实验 Compiler-RT 


要 查看 编译 器 运行 时 库 启 动 时 的 典型 情况 ， 可 以 编写 一 个 执行 64 位 除法 的 C 程序 来 做 
一 个 简单 的 实验 : 


#include <stdio.h> 
#include <stdint.h> 
#include <stdlib.h> 
int main() { 
uint64 t a = OULL, b = OULL; 
scanf ("%]lld %lld", &a, &b); 
printf ("64-bit division is %lld\n", a / b); 
return EXIT SUCCESS; 
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~。 下载 示例 代码 
是 你 可 以 从 http://www.packtpub.com 用 你 的 账户 下 载 你 购买 的 所 有 Packt 
图 书 的 示例 代码 文件 。 如 果 你 在 其 他 地 方 购买 了 本 书 ， 可 以 访问 http://www. 
packtpub.com/support 并 注册 ， 我 们 会 将 文件 直接 发 送 给 你 。 


如 果 你 有 64 位 x86 系统 ， 请 使 用 你 的 LLVM 编译 器 来 实验 以 下 两 个 命令 : 

$ clang -S -m32 test.c -o test-32bit.S 

$ clang -S test.c -o test-64bit.S 

-m32 标志 指示 编译 器 生成 32 位 x86 程序 ， 而 -s 标志 将 用 于 在 test-32bit.s 中 为 
此 程序 生成 x86 汇编 语言 文件 。 如 果 查 看 这 个 文件 ， 就 会 看 到 每 当 程序 需要 执行 除法 时 都 会 
有 一 个 有 趣 的 调用 : 


call udivdi3 


该 函数 由 Compiler-RT 定义 ， 并 演示 了 将 在 何 处 使 用 该 库 。 但 是 ， 如 果 省 略 -m32 标志 
并 使 用 64 位 x86 编译 器 ， 即 与 生成 test-64bit.s 汇编 文件 的 第 二 个 编译 器 命令 一 样 ， 
则 不 会 再 看 到 需要 Compiler- RT 协助 的 程序 ， 因 为 它 可 以 通过 单个 指令 完成 除法 运算 : 


divgq -24 (%rbp) 


2.2 ”使 用 DragonEgg 插件 


如 前 所 述 ，LLVM 项 目 初 期 依赖 于 GCC， 没 有 自己 的 C/C++ 前端 。 在 那 时 ,你 需要 下 
载 一 个 名 为 1lvm-gcc 的 GCC 源 代码 树 并 将 其 完整 编译 ， 才 能 使 用 LLVM。 由 于 编译 涉及 
完整 的 GCC 软件 包 ， 需 要 知道 自己 重建 GCC 所 需 的 所 有 必要 的 GNU 知识 ， 因 此 这 是 一 项 
非常 耗 时 上 且 环 手 的 任务 。DragonEgg 项 目 为 利用 GCC 插件 系统 提出 了 一 个 聪明 的 解决 方案 ， 
它 将 LLVM 逻辑 分 离 到 它 自 己 的 一 个 更 小 的 代码 树 中 。 这 样 ， 用 户 不 再 需要 重建 整个 GCC 
包 ， 而 只 需 构建 一 个 插件 ， 然 后 将 其 加 载 到 GCC 中 即 可 。DragonEgg 也 是 LLVM 项 目下 唯 
一 获得 GPL 授权 的 项 目 。 

即使 Clang 已 经 兴起 ，DragonEgg 至 今 仍然 存在 ， 因 为 Clang 只 处 理 C 和 C++ 语言 ， 
而 GCC 能 够 解析 更 多 种 类 的 语言 。 通 过 使 用 DragonEgg 插件 ， 可 以 使 用 GCC 作为 LLVM 
编译 器 的 前 端 ， 从 而 能 够 编译 GCC 支持 的 大 多 数 语 言 ， 包 括 Ada、C、C++ 和 FORTRAN， 
并 且 部 分 支持 Go、Java、Objective-C 和 Objective-C++。 

该 插件 用 LLVM 的 相应 部 分 替代 GCC 的 中 间 和 后 端 ， 并 自动 执行 所 有 编译 步 又， 能 满 
足 你 对 一 流 的 编译 器 驱动 程序 的 期 望 。 图 2-1 是 这 种 新 场景 的 编译 流程 。 
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如 果 你 愿意 ， 可 以 使 用 -fplugin-arg-dragonegg-emit-ir -S 标 志 将 编译 过 
程 停 止 在 LLVM IR 生成 阶段 ， 并 使 用 LLVM 工具 分 析 和 调查 前 端的 结果 ， 或 者 手动 使 用 
LLVM 工具 完成 编译 过 程 。 我 们 将 很 快 看 到 一 个 例子 。 

由 于 DragonEgg 是 一 个 LLVM 分 支 项 目 ， 维 护 人 员 无 法 以 维护 LLVM 主 项 目 那 样 的 
频率 更 新 该 项 目 。 在 编写 本 书 时 ，DragonEgg 最 新 的 稳定 版 本 是 3.3 版 本 ， 并 且 被 绑 定 到 
LLVM 3.3 的 工具 集中 。 因 此 ， 如 果 你 生成 LLVM 位 码 (使 用 LLVM IR 写 在 磁盘 上 的 程序 )， 
则 不 能 使 用 3.3 以 外 版 本 的 LLVM 工具 分 析 此 文件 ， 也 不 能 进行 优化 或 继续 编译 。 你 可 以 在 
http://dragonegg.11vm.org 上 找到 DragonEgg 官方 网 站 。 


2.2.1 构建 DragonEgg 


要 编译 并 安装 DragonEgg， 请 首先 从 http://llvm.org/releases/3.3/dragonegg- 
3.3.src.tar.gz 获取 源 代码 。 对 于 Ubuntu， 请 使 用 以 下 命令 : 


$ wget http://llvm.org/releases/3.3/dragonegg-3.3.src.tar.gz. 
$ tar xzvf dragonegg-3.3.src.tar.gz 


$ cd dragonegg-3.3.src 
如 果 你 希望 从 SVN 库 中 获取 最 新 但 不 稳定 的 源 代码 ， 请 使 用 以 下 命令 : 
$ svn checkout http://llvm.org/svn/llvm-project/dragonegg/trunk dragonegg 


对 于 GIT 镜像 ， 请 使 用 以 下 命令 : 

$ git clone http://llvm.org/git/dragonegg .git 

要 执行 编译 和 安装 ， 需 要 提供 LLVM 安装 路 径 。LLVM 版 本 必须 与 正在 安装 的 
DragonEgg 版 本 相 匹 配 。 假 设 使 用 与 第 1 章 中 相同 的 安装 前 级 /usr/1local/1l1vm， 并 假 
设 GCC 4.6 已 安装 并 存在 于 你 的 shell PATH 变量 中 ， 则 应 使 用 以 下 命令 : 


$ GCC=gcc-4.6 LLVM CONFIG=/usr/local/llvm/bin/llvm-config make 
$ cp -a dragonegg.so /usr/local/llvm/lib 


请 注意 ， 该 项 目 缺 少 自动 工具 或 CMake 项 目 文件 。 你 应 该 使 用 make 命令 直接 构建 。 如 
果 你 的 gcc 命令 已 经 提供 了 你 需要 的 正确 GCC 版 本 ， 则 可 以 在 运行 make 时 省 略 GCC = 
gcc-4.6 前 级 。 构 建 后 将 生成 名 为 darzagonegg.so 并 且 格 式 为 共享 库 的 插件 ， 你 可 以 使 用 
以 下 GCC 命令 行 调用 该 插件 〈 假 设 你 正在 编译 一 个 经 典 的 “Hello，World 1”C 代码 ): 


$ gcc-4.6 -fplugin=/usr/local/llvm/lib/dragonegg.so hello.c -o hello 


< 、 虽然 DragonEgg 理论 上 支持 GCC 4.5 及 更 高 版 本 ， 但 强烈 建议 使 用 GCC 4.6。 
Q DragonEgg 没有 在 其 他 GCC 版 本 中 进行 过 广泛 测试 和 维护 。 


2.2.2 使 用 DragonEgg 和 LLVM 工具 了 解 编译 流程 
如 果 你 希望 看 到 前 端的 运行 情况 ,请 使 用 -Ss -fplugin-arg-dragonegg-emit- 


ir 标志 ,该 标志 将 产生 以 LLYM IR 代码 表示 的 人 工 可 读 文件 : 


$ gcc-4.6 -fplugin=/usr/local/llvm/lib/dragonegg.so -S -fplugin-arg- 
dragonegg-emit-ir hello.c -o hello.11 


$ cat hello.1l1 

一 旦 编译 带 将 程序 转换 为 IR 则 停止 编译 ， 并 将 内 存 中 的 表示 内 容 写 人 磁盘 的 能 力 是 
LLVM 的 一 个 独 有 特征 。 大 多 数 其 他 编译 器 无 法 做 到 这 一 点 。 在 欣赏 LLVM IR 如 何 表示 源 
程序 之 后 ， 你 可 以 手动 使 用 多 个 LLVM 工具 继续 完成 编译 过 程 。 以 下 命令 调用 一 个 特殊 的 
汇编 程序 ， 将 LLVM 从 文本 形式 转换 为 二 进 制 形式 ， 仍 保存 在 磁盘 上 : 


$ llvm-as hello.11 -o hello.bc 
$ file hello.bc 
hello.bc: LLVM bitcode 


如 果 你 愿意 ， 可 以 用 一 个 特殊 的 及 反 汇编 器 (1llvm-dis) 把 它 翻译 回 可 读 的 形式 。 以 下 
工具 将 在 显示 成 功 完成 代码 转换 的 相关 统计 信息 的 同时 ， 进 行 独立 于 编译 目标 的 优化 : 


$ opt -stats hello.bc -0o hello.bc 


-stats 标志 是 可 选 的 。 之 后 ， 你 可 以 使 用 LLVM 后 端 工具 将 其 转换 为 目标 机 器 的 汇 
编 语 言 


$ llc -stats hello.bc -o hello.S 


再 强调 一 下 ，-stats 标志 是 可 选 的 。 由 于 hello.s 是 一 个 汇编 文件 ， 因 此 既 可 以 
使 用 GNU binutils 汇 编 器 ， 也 可 以 使 用 LLVM 汇编 器 。 在 下 面 的 命令 中 ， 我 们 将 使 用 
LLVM 汇编 器 : 


$ llvm-mc -filetype=obj hello.8S -o hello.o 

因为 LLVM 链接 器 项 目 11d 目前 正在 开发 中 ， 还 没有 集成 到 核心 LLVM 项 目 中 ， 所 以 
LLVM 默认 使 用 你 的 系统 链接 器 。 因 此 ， 如 果 你 没有 11d， 可 以 使 用 常规 的 编译 器 驱动 程序 
来 完成 编译 ， 这 会 激活 你 的 系统 链接 器 : 


$ gcc hello.o -0o hello 


请 记 住 ， 出 于 性 能 方面 的 原因 ， 除 了 目标 文件 之 外 ， 真 正 的 LLVM 编译 器 驱动 程序 在 
任何 阶段 都 不 会 将 程序 表示 内 容 写 人 磁盘 ， 因 为 它 仍 然 缺 少 集成 的 链接 器 。 它 会 使 用 内 存 中 
的 表示 内 容 并 协调 几 个 LLVM 组 件 进行 编译 。 


2.2.3 理解 LLVM 测试 套件 

LLVM 测试 套件 包括 一 套用 于 测试 LLVM 编译 器 的 官方 基准 程序 。 该 测试 套件 对 于 
LLVM 开发 人 员 非 常 有 用 ， 它 通过 编译 和 运行 这 些 程序 来 验证 优化 和 编译 器 的 改进 。 如 果 正 
在 使 用 LLVM 的 非 稳 定 版 本 ， 或 者 更 改 了 LLVM 源 代码 并 怀疑 某 些 功 能 不 能 正常 工作 ， 那 
么 可 以 自行 运行 该 测试 套件 。 但 请 记 住 ， 在 LLVM 主 源 代码 树 中 存在 更 简单 的 LLVM 回归 
测试 和 单元 测试 ， 可 以 使 用 make check-all 轻松 运行 它们 。 测 试 套件 不 同 于 传统 的 回归 
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测试 和 单元 测试 ， 因 为 它 包含 了 整个 基准 程序 。 

必须 将 LLVM 测试 套件 放 在 LLVM 源 代码 树 中 ， 以 允许 LLVM 构建 系统 识别 它 。 可 以 
从 http://llvm.org/releases/3.4/test-suite-3.4.src.tar.gz 找 到 版 本 3.4 
的 资源 。 

要 获取 源 代码 ， 请 使 用 以 下 命令 : 

$ wget http://llvm.org/releases/3.4/test-suite-3.4.src.tar.gz 


$ tar xzf test-suite-3.4.src.tar.gz 


$ mv test-suite-3.4 llvm/projects/test-suite 


如 果 你 喜欢 通过 SVN 下 载 ， 以 获得 最 新 但 可 能 不 稳定 的 版 本 ， 请 使 用 以 下 命令 : 


$ cd llvm/projects 


$ svn checkout http://llvm.org/svn/llvm-project/test-suite/trunk test- 
suite 


如 果 你 喜欢 使 用 GIT， 请 使 用 以 下 命令 : 

$ cd llvm/projects 

$ git clone http://llvm.org/git/llvm-project/test-suite.git 

需要 重新 生成 LLVM 的 构建 文件 才能 使 用 测试 套件 。 在 此 特例 中 ， 不 能 使 用 CMake。 必 
须 使 用 经 典 的 配置 脚本 来 构建 测试 套件 。 读 者 可 以 参考 第 1 章 中 介绍 的 配置 步骤 。 

测试 套件 有 一 套 Makefile 文件 ， 用 于 测试 和 检查 基准 。 也 可 以 提供 一 个 自 定 义 的 
Makefile 来 评估 自 定义 程序 。 请 将 自 定 义 Makefile 文件 放 在 测试 套件 的 源 代码 目录 中 ， 并 
使 用 命名 模板 1lvm/projects/test-suite/TEST.<custom>.Makefile 命名 该 文件 ， 
其 中 ， 必 须 将 <custom> 记号 替换 为 所 需 的 任何 名 称 ， 比 如 llvm/projects/test- 
suite/TEST.example.Makefile, 


MU 、， 你 需要 重新 生成 LLVM 构建 文件 ， 以 允许 自 定义 或 经 过 更 改 的 Makefile 文 件 
生效 。 


在 配置 期 间 ， 将 在 基准 测试 程序 将 要 运行 的 LLVM 对 象 目录 中 创建 测试 套件 的 目录 。 
要 运行 并 测试 示例 Makefile 文件 ， 请 进入 第 1 章 中 的 对 象 目录 路 径 ， 然 后 执行 以 下 命令 : 


$ cd your-llvm-build-folder/projects/test-suite 


$ make TEST="example" report 


2.2.4 ”使 用 LLDB 


LLDB (低级 调试 器 ) 项 目 是 一 个 用 LLYM 基础 架构 构建 的 调试 器 ， 它 作为 在 Mac OS X 
上 的 Xcode 5 调试 器 而 被 积极 开发 出 来 。 从 2011 年 开始 开发 到 写本 书 时 为 止 , LLDB 还 没有 
在 Xcode 范围 之 外 发 布 一 个 稳定 的 版 本 。 可 以 从 http://llvm.org/releases/3.4/ 
11db-3.4.src.tar.gz 获取 LLDB 资源 。 像 许多 依赖 于 LLVM 的 项 目 一 样 ， 可 以 通过 
将 其 集成 到 LLVM 构建 系统 中 来 轻松 构建 它 。 要 做 到 这 一 点 ， 只 需 将 其 源 代 码 放 在 LLVM 
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tools 文件 夹 中 ， 如 下 例 所 示 : 


$ wget http://llvm.org/releases/3.4/11ldb-3.4.src.tar.gz 
$ tar xvf lldb-3.4.src.tar.gz 
$ mv lldb-3.4 llvm/tools/lldb 


也 可 以 使 用 其 SVN 存储 库 来 获得 最 新 版 本 : 


$ cd llvm/tools 
$ svn checkout http://llvm.org/svn/llvm-project/lldb/trunk lldb 


如 果 你 愿意 ， 还 可 以 使 用 GIT 镜像 来 获取 它 : 


$ cd llvm/tools 
$ git clone http://llvm.org/git/llvm-project/lldb.git 


对 于 GNU/Linux 系统 ，LLDB 仍然 处 于 实验 阶段 。 


在 构建 之 前 ， 请 注意 LLDB 有 一 些 软件 先决 条 件 : Swig 、libedit ( 仅 适 用 于 Linux) 和 
Python。 例 如 ,在 Ubuntu 系统 上 ， 可 以 使 用 以 下 命令 来 解决 这 些 依赖 关系 : 


$ sudo apt-get install swig libedit-dev Python 


请 记 住 ,与 本 章 介 绍 的 其 他 项 目 一 样 ， 需 要 重新 生成 LLVM 构建 文件 以 允许 进行 
LLDB 编译 。 请 按照 第 1 章 中 所 述 的 步骤 从 源 代码 构建 LLVM。 
要 对 最 近 的 11db 安装 进行 简单 测试 ， 只 需 使 用 -v 标志 运行 ， 即 可 打印 其 版 本 : 


$ lldb -v 
lldb version 3.4 ( revision ) 
使 用 LLDB 执行 调试 会 话 


为 了 演示 如 何 使 用 LLDB， 我 们 将 启动 一 个 调试 会 话 来 分 析 Clang 二 进 制 文件 。 你 可 
以 看 到 Clang 二 进 制 文件 包含 许多 的 C++ 符号 。 如 果 你 使 用 默认 选项 编译 LLVMVClang 项 
目 ， 将 得 到 带 调试 符号 的 Clang 二 进 制 文件 。 如 果 在 运行 配置 脚本 生成 LLVM Makefile 时 省 
略 --enable-optimized 标志 ， 或 者 在 运行 CMake 文件 时 使 用 -DCMAKE BUILD TYPE= 
"Debug" (这 是 默认 构建 类 型 )， 都 会 发 生 这 种 情况 。 

如 果 你 熟悉 GDB， 可 能 有 兴趣 参考 http://1ldb.1llvm.org/11db-gdb.html 中 
的 表格 ， 该 表格 列 出 了 常用 GDB 命令 及 相应 的 对 等 LLDB 命令 。 

与 GDB 一 样 ， 我 们 通过 传递 将 要 调试 的 可 执行 文件 的 路 径 作为 命令 行 参数 来 启动 
LLDB: 


$ lldb where-your-llvm-is-installed/bin/clang 


Current executable set to 'where-your-llvm-is-installed/bin/clang' 
(x86 64) . 


(11db) break main 


Breakpoint 1: where = clang main + 48 at driver.cpp:293, address = 
0x000000001000109e0 


外 部 项 目 23 


为 了 开始 调试 ， 我 们 将 命令 行 参数 提供 给 Clang 二 进 制 文件 。 我 们 将 使 用 -v 参数 ， 它 
将 打印 Clang 版 本 : 


(1ldb) run -v 


在 LLDB 到 达 我 们 的 断 点 之 后 ， 就 可 以 用 next 命令 单 步 执 行 每 一 行 C++ 代码 。 与 
GDB 一 样 ，LLDB 也 可 以 接受 任何 命令 缩写 ， 前 提 是 这 个 缩写 不 会 带 来 歧义 ， 例 如 用 mn 代 
替 next : 


(11db) n 


要 查看 LLDB 如 何 打 印 C++ 对象， 请 在 声明 argv 或 ArgAllocator 对 象 之 后 单 步 
执行 到 达 该 行 并 打印 它 : 
(lldb) n 
(1L11db) p ArgAllocator 
(llvm: :SpecificBumpPtrAllocator<char>) $0 = { 
Allocator = { 
SlabSsize = 4096 
SizeThreshld = 4096 


DefaultslabAllocator = (Allocator = llvm: :MallocAllocator @ 
0x00007f85f1497f68) 


Allocator = 0x0000007fffbff200 
Curslab = 0x0000000000000000 
CurPtr = 0x0000000000000000 
End = 0x0000000000000000 
BytesAllocated = 0 
} 
} 


你 觉得 满意 后 ， 用 g 命令 退出 调试 器 : 
(lldb) qa 


Quitting LLDB will kill one or more processes. Do you really want to 
proceed: [Y/n] y 


2.2.5 libc++ 标准 库 介绍 


libc++ 库 是 LLYM 项 目 重 写 的 C++ 标准 库 ， 它 支持 最 新 的 C++ 标准 (包括 C++ 11 和 
C++ 1y)， 并 且 在 MIT 许可 证 和 UIUC 许可 证 下 获得 双重 许可 。libc++ 库 是 Compiler-RT 的 
重要 伙伴 ， 是 用 Clang++ 构建 最 终 C++ 可 执行 文件 时 所 使 用 的 运行 时 库 的 一 部 分 ， 必 要 时 
也 包含 libclc ( OpenCL 运行 时 库 )。 它 不 同 于 Compiler-RT， 因 为 并 非 一 定 要 构建 它 。Clang 
并 不 局 限于 libc++， 在 没有 libc++ 的 情况 下 ， 它 可 以 将 你 的 程序 与 GNU libstdc++ 链接 。 如 
果 这 两 个 库 都 存在 ， 你 可 以 使 用 -stdlib 选项 指定 Clang++ 使 用 哪个 库 。libc++ 库 支 持 
x86 和 x86_64 处 理 器 ， 而 且 它 被 设计 为 用 于 Mac OS X 和 GNU/Linux 系统 的 GNU libstdc++ 
的 替代 品 。 


岂 GNU/Linux 上 的 libc++ 支持 仍 在 开发 中 ， 并 且 不 像 在 Mac OS X 上 那样 稳定 。 


据 libc++ 开发 人 员 称 ， 继 续 开发 GNU libstdc++ 的 主要 障碍 之 一 是 需要 重 写 代 码 来 支持 
更 新 的 C++ 标准 ， 并 且 主 线 libstdc++ 开发 切换 到 GPLv3 许可 证 之 后 ， 以 至 于 一 些 依赖 于 
LLVM 项 目的 公司 无 法 使 用 。 请 注意 ，LLVM 项 目 在 商业 产品 中 经 常 使 用 与 GPL 许可 不 兼 
容 的 方式 。 面 对 这 些 挑战 ，LLVM 社区 决定 主要 为 Mac OS X 开发 新 的 C++ 标准 库 ， 同 时 
支持 Linux。 

在 你 的 苹果 电脑 中 获取 libc++ 的 最 简单 方法 是 安装 Xcode 4.2 或 更 高 版 本 。 

如 果 你 打算 自己 为 GNU/Linux 机 器 构建 库 ， 请 记 住 ，C++ 标准 库 由 库 本 身 和 一 个 低级 
函数 层 组 成 ， 这 个 函数 层 实现 了 用 于 处 理 异常 和 运行 时 类 型 信息 〈( RTTI) 的 若干 功能 。 这 种 
关注 点 的 分 离 使 得 C++ 标准 库 更 容易 移植 到 其 他 系统 。 在 构建 标准 库 时 ， 它 也 提供 了 不 同 
的 选项 。 你 可 以 构建 与 libsupc++ (这 个 较 低层 的 GNU 实现 ) 或 者 libc++ abi (LLVM 团队 的 
实现 ) 链接 的 libc++。 不 过 ，libc++ abi 目前 只 支持 Mac OS X 系统 。 

要 在 GNU/Linux 机 器 上 用 libsupc++ 构建 libc++， 首 先 需 要 下 载 源 代码 包 : 


$ wget http://11Lvm.org/releases/3.4/1ibcxx-3.4.Src.tar.gz 
$ tar xvf libcxx-3.4.src.tar.gz 
$ mv libcxx-3.4 libcxx 


在 撰写 本 书 之 前 ,仍然 无 法 像 在 其 他 项 目 中 那样 ， 依 靠 LLVM 构建 系统 来 创建 库 文件 。 
因此 ， 请 注意 ， 这 次 我 们 没有 将 libc++ 源 代码 放 入 LLVM 源 代 码 树 中 。 
另外 ， 也 可 以 使 用 SVN 版 本 库 中 的 实验 性 版 本 : 


$ svn co http://llvm.org/svn/llvm-project/libcxx/trunk libcxx 
还 可 以 使 用 GIT 镜像 : 
$ git clone http://llvm.org/git/llvm-project/libcxx.git 


只 要 你 有 基于 LLVM 的 工作 编译 器 ， 就 需要 生成 只 使 用 基于 LLVM 的 新 编译 器 的 
libc++ 构建 文件 。 在 这 个 例子 中 ， 我们 假定 我 们 的 路 径 中 有 一 个 LLVM 3.4 工作 编译 器 。 

要 使 用 libsupc++， 首 先 需 要 知道 它 的 头 文件 在 你 的 系统 中 安装 在 什么 位 置 。 由 于 它 是 
GNU/Linux 的 常规 GCC 编译 器 的 一 部 分 ， 因 此 可 以 使 用 以 下 命令 来 找到 它 : 


$ echo | g++ -Wp,-v -x c++ - -fsyntax-only 
#include "..." search starts here: 
#include <...> search starts here: 
/usr/include/c++/4.7.0 
/usr/include/c++/4.7.0/x86 64-pc-linux-gnu 
(Subsequent entries omitted) 


通常 ， 前 两 个 路 径 即 libsupc++ 头 文件 的 位 置 。 要 确认 这 一 点 ， 请 查找 libsupc++ 头 文 
件 (如 bits/exception ptr.h) 是 否 存在 : 


$ find /usr/include/c++/4.7.0 | grep bits/exception ptr.h 
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之 后 ， 生 成 libc++ 构建 文件 ， 以 便 使 用 基于 LLVM 的 编译 器 编译 它 。 要 执行 此 操作 ， 
请 分 别 改写 用 于 定义 系统 C 和 C++ 编译 器 的 shell cc 和 cxx 环境 变量 ， 以 使 用 你 想 骨 人 
libc++ 的 LLVM 编译 器 。 要 使 用 CMake 与 libsupc++ 一 起 构建 libc++， 需 要 定义 CMake 
参数 LIBCXX_CXX_ABI (该 参数 定义 要 使 用 的 低级 库 ) 和 参数 LIBCXX_LIBSUPCXX 
INCLUDE_PATHS (这 是 一 个 用 分 号 分 隔 的 路 径 列表 ， 路 径 指 向 你 刚 发 现 的 包含 libsupc++ 
include 文件 的 文件 夹 ): 


$ mkdir where-you-want-to-build 
$ cd where-you-want-to-build 


$ CC=clang CXX=clang++ cmake -DLIBCXX CXX ABI=libstdc++ 
-DLIBCXX LIBSUPCXX INCLUDE PATHS="/usr/include/c++/4.7.0;/usr/ 
include/c++/4.7.0/x86 64-pc-linux-gnu" -DCMAKE INSTALL PREFIX= 
n/usr" ../libcxx 


在 这 个 阶段 ， 确 保 . ./1ibcxx 是 到 达 libc++ 源 文件 夹 的 正确 路 径 。 运 行 make 命令 
来 构建 项 目 。 使 用 sudo 作为 安装 命令 ， 因 为 我 们 将 在 /usr 中 安装 库 ， 以 便 以 后 可 以 使 用 
clang++ 来 查找 库 : 


$ make && sudo make install 


调用 clang++ 编译 C++ 项目 时 ， 可 以 通过 使 用 -stdlib=1ibc++ 标志 来 实验 新 库 和 
最 新 的 C++ 标准 。 
要 验证 你 的 新 库 ， 请 使 用 以 下 命令 编译 一 个 简单 的 C++ 应 用 程序 : 


$ clang++ -stdlib=libc++ hello.cpp -o hello 


可 以 使 用 readelf 命令 执行 一 个 简单 的 实验 来 分 析 hello 二 进 制 文件 ， 并 确认 它 确 
实 与 新 的 libc++ 库 链 接 : 
$ readelf d hello 
Dynamic section at offset 0x2f00 contains 25 entries: 
Tag Type Name/Value 
0x00000001 (NEEDED) Shared library: [libc++.s0.1] 


前 面 的 代码 省 略 了 后 面 的 条 目 。 我 们 看 到 正好 在 第 一 个 ELF 动态 段 条 目 中 有 一 个 特定 
的 请 求 来 加 载 我 们 刚刚 编译 的 1ibc++.so.1 共享 库 ， 由 此 可 以 确认 我 们 的 C++ 二 进 制 文 
件 现在 使 用 新 的 LLVM 的 C++ 标准 库 。 你 可 以 在 官方 项 目 网 站 http://Libcxx.1LLvm. 
org 上 找到 更 多 信息 。 


2.3 总 结 


LLVM 由 几 个 子 项 目 组 成 ， 其 中 一 些 对 主编 译 器 驱动 程序 来 说 不 是 必需 的 ， 但 却 是 有 用 
的 工具 和 库 。 在 本 章 中 ,我们 展示 了 如 何 构建 和 安装 这 些 组 件 。 后 续 章 节 将 更 加 详细 地 探讨 
这 些 工 具 的 细节 。 我 们 建议 读者 以 后 在 需要 获取 构建 和 安装 操作 说 明 时 再 重读 本 章 。 

在 下 一 章 中 ， 我 们 将 向 你 介绍 LLVM 核心 库 的 设计 和 工具 。 
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LLVM 项 目 由 一 些 库 和 工具 组 成 ， 它 们 一 起 构成 一 个 大 型 的 编译 器 基础 架构 。 将 所 有 这 
些 零 件 连接 在 一 起 需要 精心 的 设计 ， 这 是 项 目的 关键 。 在 整个 过 程 中 ，LLVM 都 在 强调 “一 
切 都 是 库 ” 的 理念 ， 只 有 相当 少量 的 代码 是 不 可 重用 的 ， 并 且 不 包括 特定 的 工具 。 尽 管 如 
此 ,仍然 有 大 量 的 工具 允许 用 户 以 多 种 方式 从 命令 终端 运行 库 。 在 本 章 中 ,我 们 将 介绍 以 下 
主题 : 

e LLVM 核心 库 的 概述 和 设计 

e 编译 器 驱动 程序 的 工作 原理 

e 编译 器 驱动 程序 进 阶 : 了 解 LLVM 中 间 工 具 

e 如 何 编写 你 的 第 一 个 LLVM 工具 

e。 关于 浏览 LLVM 源 代码 的 常规 建议 


3.1 LLVM 的 基本 设计 原理 及 其 历史 


LLVM 是 一 个 众所周知 的 教学 框架 ， 这 是 因为 它 的 几 个 工具 的 组 织 化 程度 很 高 ， 从 而 使 
得 感 兴趣 的 用 户 可 以 观察 到 编译 过 程 的 许多 步骤 。 其 设计 决策 可 以 追溯 到 十 多 年 前 的 第 一 个 
版 本 ， 当 时 这 个 专注 于 后 端 算法 的 项 目 只 是 依靠 GCC 将 C 这 样 的 高 级 语言 转换 成 LLVM 中 
间 表 示 (intermediate representation， 简 称 IR)。 如 今 ，LLVM 的 设计 核心 是 它 的 IR。 它 使 
用 的 静态 单 赋值 形式 (SSA) 具有 两 个 重要 特征 : 

e 代码 被 组 织 为 三 地 址 指令 

e 它 有 数目 不 受 限 制 的 寄存 器 

但 是 ， 这 并 不 意味 着 LLVM 只 有 一 种 表示 程序 的 形式 。 在 整个 编译 过 程 中 ， 其 他 中 间 
数据 结构 都 保持 程序 逻辑 结构 ， 并 且 有 助 于 跨 主要 检查 点 进行 编译 。 从 技术 上 讲 ， 这 些 结构 
也 是 程序 的 中 间 表 示 形 式 。 例 如 ，LLVM 在 不 同 的 编译 阶段 采用 以 下 额外 的 数据 结构 : 

e 将 C 或 C++ 转换 为 LLVM IR 时 ，Clang 将 使 用 抽象 语法 树 ( AST) 结构 (Trans- 

lationUnitDecl 类 ) 在 内 存 中 表示 程序 。 

e 在 将 LLVM IR 转换 为 特定 于 机 器 的 汇编 语言 时 ，LLVM 首先 将 程序 转换 为 有 向 无 环 

( DAG ) 格式 以 便 选择 指令 ( selectionDAG 类 )， 然 后 将 其 转换 回 三 地 址 表示 以 
便 进 行 指令 调度 (MachineFunction 类 )。 

e 为 了 实现 汇编 器 和 链接 器 ，LLVM 使 用 第 四 种 中 间 数 据 结构 (MCModule 类 ) 在 对 象 

文件 的 上 下 文中 保存 程序 表示 。 

相 比 于 LLVM 中 其 他 形式 的 程序 表示 ，LLVM IR 是 最 重要 的 一 个 ， 它 具有 不 仅 是 内 存 中 
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的 表示 而 且 还 能 存储 在 磁盘 上 的 特性 。LLVM IR 因 使 用 特定 的 编码 而 能 存在 于 外 部 世界 的 这 
一 事实 是 在 项 目 初期 做 出 的 另 一 个 重要 决策 ， 反 映 了 当时 研究 终身 程序 优化 的 学 术 兴 趣 。 

在 这 个 理念 中 ， 编 译 器 的 目标 不 只 是 在 编译 时 进行 优化 ， 而 且 还 要 探索 利用 在 安装 时 、 运 
行 时 和 空闲 时 (程序 未 运行 时 ) 的 优化 机 会 。 这 样 ， 在 整个 程序 的 生命 周期 中 都 进行 优化 ， 这 
也 解释 这 个 概念 的 名 字 。 例 如 ， 当 用 户 没 有 运行 程序 并 且 计 算 机 空 闪 时 ， 操 作 系 统 可 以 启动 编 
译 器 守护 进程 来 处 理 运行 时 收集 的 性 能 分 析 数 据 ， 以 便 针 对 该 用 户 的 特定 用 例 重新 优化 程序 。 

请 注意 ， 由 于 能 够 存储 在 磁盘 上 ，LLVM IR ( 它 是 终身 程序 优化 的 关键 ) 为 对 整个 程序 
进行 编码 提供 了 男 一 种 方式 。 当 整个 程序 以 编译 器 IR 的 形式 存储 时 ， 还 可 以 执行 新 的 一 系 
列 跨 越 单个 编译 单元 或 C 文件 边界 的 非常 有 效 的 跨 程 序 优 化 。 因 此 ， 这 也 为 进行 强大 的 链 
接 时 优化 提供 了 条 件 。 

另 一 方面 ， 如 果 终 身 程序 优化 成 为 现实 ， 则 程序 分 发 需要 在 LLVM IR 级 别 发 生 ， 这 目 
前 还 没有 实现 。 这 意味 着 LLVM 将 作为 平台 或 虚拟 机 运行 ， 并 与 Java 展开 竞争 ， 这 也 面 
临 着 严峻 的 挑战 。 例 如 ，LLVM IR 不 是 像 Java 那样 独立 于 目标 机 器 的 。LLVM 也 没有 投 
资 于 在 安装 后 进行 强大 的 基于 反馈 的 优化 。 如 果 有 兴趣 进一步 了 解 这 些 技术 挑战 ， 请 阅读 
http://lists.cs.uiuc.edu/pipermail/llvmdev/2011-October/043719.html 
上 的 “LLVMdev” 讨 论 主题 。 

随 着 项 目 逐 渐 成 熟 ， 维 护 编译 器 IR 在 磁盘 上 表示 的 设计 决策 仍然 是 为 了 实现 链接 时 
优化 ， 而 较 少 关注 终身 程序 优化 的 原始 想法 。 最 终 ，LLVM 的 核心 库 通过 放弃 低级 虚拟 机 
(Low Level Virtual Machine) 这 个 名 称 ， 正 式 表 明 对 成 为 一 个 平台 不 感 兴 趣 ， 而 仅仅 由 于 历 
史 原 因 使 用 了 LLVM 这 个 名 称 ， 从 而 明确 了 LLVM 项 目 立志 成 为 强大 和 实用 的 C/C++ 编译 
器 ， 而 不 是 Java 平台 的 竞争 对 手 。 

尽管 如 此 ， 除 了 链接 时 优化 之 外 ,磁盘 表示 本 身 也 有 很 好 的 应 用 前 景 ， 有 些 组 织 正 在 努 
力 将 其 实现 。 例 如 ，FreeBSD 社区 和 希望 在 可 执行 文件 中 嵌入 其 LLVM 程序 表示 ， 以 允许 进 
行 安装 时 或 离线 的 微 架 构 优 化 。 在 这 种 情况 下 ， 即 使 程序 编译 为 通用 x86 形式 ， 当 用 户 安装 
程序 时 (比如 ， 在 特定 的 Intel Haswell x86 处 理 器 上 安装 程序 时 )，LLVM 基础 架构 就 可 以 使 
用 二 进 制程 序 的 LLVM 表示 形式 ， 对 程序 进行 特殊 处 理 以 使 用 Haswell 支持 的 新 指令 。 尽 
管 这 是 一 个 正在 评估 的 新 想法 ， 但 它 表 明 磁 盘 上 的 LLVM 表示 可 应 用 于 激进 的 新 解决 方案 。 
我 们 能 期 望 的 优化 主要 针对 微 架 构 ， 因 为 Java 中 完全 的 平台 无 关 性 在 LLVM 中 是 不 切实 
际 的 ， 目 前 仅 在 一 些 外 部 项 目 上 探索 这 种 可 能 性 (参见 PNaCl，Chromiu 的 Portable Native 
Client)。 

作为 编译 器 IR， 用 于 指导 核心 库 开 发 的 两 个 LLVM IR 的 基本 原则 如 下 : 

e SSA 表示 和 人 允许 快速 优化 的 无 限 寄存 器 

e 通过 将 整个 程序 存储 在 磁盘 IR 表示 中 以 实现 便捷 的 链接 时 优化 


3.2 理解 目前 的 LLVM 
目前 ，LLVM 项 目 已 经 发 展 起 来 ， 并 拥有 数量 巨大 的 编译 器 相关 工具 。 实 际 上 ，LLVM 
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这 个 名 称 可 能 是 以 下 任意 一 项 : 

e LLVM 项 目 /基础 架构 : 这 是 对 组 成 一 个 完整 编译 器 的 如 下 几 个 项 目的 总 称 : 前 端 、 
后 端 、 优 化 器 、 汇 编 器 、 连 接 器 libc++ .compiler-RT 和 JIT 引擎 。 例 如 ， 在 “LLVM 
由 几 个 项 目 组 成 ”这 句 话 中 “LLVM ”就 是 这 个 意思 。 
基于 LLVM 的 编译 器 : 这 是 一 个 部 分 或 全 部 使 用 LLVM 基础 架构 所 构建 的 编译 器 。 
例如 ， 编 译 器 可 能 使 用 LLVM 作为 前 端 和 后 端 ， 但 使 用 GCC 和 GNU 系统 库 来 执 
行 最 终 的 链接 。 例 如 ， 在 “我 用 LLVM 将 C 程 序 编译 到 MIPS 平 台 ” 这 句 话 中 的 
“LLYM” 就 是 这 个 意思 。 

LLVM 库 : 这 是 LLVM 基础 架构 的 可 重用 代码 部 分 。 例 如 ， 在 “我 的 项 目 使 用 
LLVM 的 即时 编译 框架 生成 代码 ”这 句 话 中 “LLVM” 就 是 这 个 意思 。 
LLVM 核心 : 在 中 间 语 言 级 别 和 后 端 算法 上 进行 的 优化 形成 了 项 目 开 始 时 的 LLVM 
核心 。“LLVM 和 Clang 是 两 个 不 同 的 项 目 ” 这 句 话 中 的 “LLVM ”就 是 这 个 意思 。 
LLVM IR : 这 是 LLVM 编译 器 中 间 表 示 。 在 诸如 “我 构建 了 一 个 前 端 来 将 我 自己 的 
语言 翻译 成 LLVM ”这 样 的 句子 中 ,“LLVM ”就 有 LLVM IR 的 意思 。 
要 了 解 LLVM 项 目 ， 需 要 知道 基础 架构 中 最 重要 的 部 分 : 
e 前 端 : 这 是 将 计算 机 程序 语言 (如 C、C++ 和 Objective-C) 转换 为 LLVM 编译 器 IR 
的 编译 步 又 。 它 包括 词法 分 析 器 、 语 法 分 析 器 、 语 义 分 析 器 和 LLVM IR 代码 生成 
器 。Clang 项 目 提供 了 一 个 插件 接口 和 一 个 单独 的 静态 分 析 工 具 用 于 进行 深度 分 析 ， 
同时 实现 了 所 有 与 前 端 相 关 的 步骤 。 更 多 详细 信息 ， 请 参阅 第 4 章 、 第 9 章 和 第 
10 举 s 
IR : LLVM IR 既 有 用 户 可 读 的 表示 形式 ， 也 有 二 进 制 编码 的 表示 形式 。 相 应 的 工具 
和 库 提 供 了 IR 构建、 组 装 和 拆 秃 的 接口 。LLVM 优化 器 还 可 以 处 理 IR， 以 应 用 大 多 
数 优化 。 我 们 将 在 第 5 章 详细 解释 IR。 
e 后 端 这 是 负责 生成 代码 的 步骤 。 它 将 LLVM IR 转换 为 特定 于 目标 的 汇编 代码 或 目 
标 代码 二 进 制 文件 。 寄 存 咒 分配 、 循 环 转换 、 突 视 孔 优化 器 以 及 特定 于 目标 的 优化 / 
转换 属于 后 端 。 我 们 在 第 6 章 对 此 进行 深入 分 析 。 

图 3-1 列 出 了 这 些 组 件 ， 让 我 们 对 在 特定 配置 下 使 用 的 整个 基础 架构 有 一 个 总 体 认识 。 
请 注意 ， 我 们 可 以 重新 组 织 这 些 组 件 ， 并 根据 不 同 的 需求 有 选择 地 使 用 它们 ， 例 如， 如 果 我 
们 不 想 探索 链接 时 优化 ， 则 不 使 用 LLVM IR 链接 器 。 
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每 个 编译 器 组 件 之 间 的 交互 可 以 通过 以 下 两 种 方式 进行 : 
e 在 内 存 中 : 该 方式 通过 一 个 单独 的 监督 工具 (如 Clang) 实现 。 该 工具 将 每 个 LLVM 
组 件 作为 一 个 库 ， 并 依赖 于 内 存 中 分 配 的 数据 结构 将 一 个 阶段 的 输出 作为 输入 提供 
给 另 一 个 阶段 。 
通过 文件 : 该 方式 通过 用 户 实现 。 用 户 启动 较 小 的 独立 工具 ,该 工具 将 特定 组 件 的 
结果 写 入 磁盘 文件 ， 具 体 取 决 于 用 户 是 否 使 用 此 文件 作为 输入 来 启动 下 一 个 工具 。 

因此 ， 像 Clang 这 样 的 高 级 工具 可 以 整合 使 用 其 他 几 个 更 小 的 工具 ， 具 体 做 法 是 链接 小 
工具 的 库 来 实现 这 些 工 具 的 功能 。 该 功能 的 可 能 性 来 自 LLVM 的 设计 十 分 重视 以 库 的 形式 
进行 大 量 代码 重用 。 此 外 ， 整 合 了 少量 库 的 独立 工具 非常 有 用 ， 因 为 这 样 的 工具 允许 用 户 通 
过 命令 行 直接 与 特定 的 LLVM 组 件 交 互 。 

例如 ， 请 看 图 3-2， 该 框图 中 下 面 三 项 是 工具 的 名 称 ， 上 面 两 项 是 实现 其 功能 的 库 。 在 
本 例 中 ，LLVM 后 端 工具 11lc 使 用 1ibLLVMCodeGen 库 实 现 部 分 功能 ， 而 仅 用 于 启动 
LLVM IR 级 优化 器 的 opt 命令 使 用 另 一 个 库 LibLLVMipa 实现 与 目标 无 关 的 过 程 间 优化 。 
最 后 ， 我 们 看 到 一 个 更 强大 的 工具 clang， 它 使 用 两 个 库 来 代替 11c 和 opt， 并 向 用 户 呈 现 
更 简单 的 接口 。 因 此 ， 用 这 样 的 高 级 工具 执行 的 任何 任务 都 可 以 分 解 成 一 系列 低级 任务 ， 同 
时 产生 相同 的 结果 。 接 下 来 的 内 容 会 继续 说 明 这 个 概念 。 实 际 上 ，Clang 能 够 执行 整个 编译 
过 程 ， 而 不 仅仅 是 完成 opt 和 11c 的 工作 。 这 就 解释 了 为 什么 在 静态 构建 中 Clang 二 进 制 
文件 通常 是 最 大 的 ， 因 为 它 链接 并 利用 整个 LLVM 生态 系统 。 


libLLVMipa libLLVMCodeGen 





3.3 与 编译 器 驱动 程序 交互 


一 个 编译 器 驱动 程序 与 汉堡 店 的 售货员 相似 ， 售 货 员 会 与 你 交互 ， 识 别 你 的 订单 ， 将 你 
的 订单 传 到 后 端 做 出 汉堡 ， 然 后 把 它 和 可 乐 或 番茄 桨 小 包 一 起 端 到 你 面前 ， 从 而 完成 你 的 订 
单 。 驱 动 程序 负责 整合 所 有 必要 的 库 和 工具 ， 以 便 为 用 户 提供 更 友好 的 体验 ， 使 用 户 不 必 单 
独 应 付 编译 器 的 各 个 阶段 ， 比 如 前 端 、 后 端 、 汇编 器 和 链接 器 等 。 一 旦 你 将 程序 源 代码 提供 
给 编译 器 驱动 程序 ， 它 就 可 以 生成 可 执行 文件 。 在 LLVM 和 Clang 中 ， 编 译 器 驱动 程序 就 
是 clang 工具 。 

假设 有 一 个 简单 的 C 程序 hello.c: 
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#include <stdio.h> 


int main() { 
printf ("Hello, World!\n"); 
return 0; 


要 为 此 简单 程序 生成 可 执行 文件 ， 请 使 用 以 下 命令 : 


$ clang hello.c -o hello 


总 请 按 第 1 章 中 的 说 明 获 取 LLVM 的 直接 可 使 用 版 本 。 


对 于 熟悉 GCC 的 人 ， 请 注意 上 述 命令 与 GCC 非常 相似 。 实 际 上 ，Clang 编译 器 驱动 
程序 被 设计 成 与 GCC 标志 和 命令 结构 相 兼 容 ， 从 而 允许 在 许多 项 目 中 用 LLVM 替代 GCC。 
对 于 Windows，Clang 也 有 一 个 名 为 clang-cl .exe 的 版 本 ， 可 模拟 Visual Studio C++ 编 
译 器 命令 行 界面 。Clang 编译 器 驱动 程序 隐 式 地 从 前 端 到 链接 器 调用 所 有 其 他 工具 。 

如 果 想 查看 驱动 程序 为 了 完成 你 的 命令 而 调用 的 所 有 其 他 工具 ， 请 使 用 -### 命令 
参数 : 

$ clang -### hello.c -o hello 

clang version 3.4 (tags/RELEASE 34/final) 

Target: x86 64-apple-darwinll.4.2 


Thread model: posix 


"/bin/clang" -ccl -triple x86 64-apple-macosx10.7.0 . -main-file-name 
hello.c (...) /examples/hello/hello.o -x c¢ hello.c 


"/opt/local/bin/ld" (...) -o hello /examples/hello/hello.o (...) 


Clang 驱动 程序 调用 的 第 一 个 工具 是 带 有 -ccl 参数 的 clang 自身 ,以便 在 启用 编译 
器 模式 时 禁用 编译 器 驱动 程序 模式 。 它 还 使 用 了 众多 参数 来 调整 C/C++ 选项 。 由 于 LLVM 
组 件 是 库 ， 因 此 clang -ccl 会 与 极 生 成 器 、 目 标 机 器 的 代码 生成 器 以 及 汇编 器 库 进行 
链接 。 因 此 ， 在 解析 之 后 ，clang -ccl 本 身 能 够 调用 其 他 库 ， 并 监视 内 存 中 的 编译 过 程 ， 
直到 目标 文件 完成 。 之 后 ，Clang 驱动 程序 (与 编译 器 clang -ccl 不 同 ) 调用 作为 外 部 
工具 的 链接 程序 来 生成 可 执行 文件 ， 如 上 述 输出 行 所 示 。 它 使 用 系统 链接 器 完成 编译 ， 因 为 
LLVM 链接 器 114 仍 在 开发 中 。 

注意 ， 使 用 内 存 要 比 使 用 磁盘 快 得 多 ， 这 使 得 中 间 编 译文 件 很 少 被 用 到 。 这 就 解释 了 为 
什么 Clang (LLVM 前 端 ， 也 就 是 第 一 个 与 输入 交互 的 工具 ) 负责 在 内 存 中 执行 剩余 的 编译 
工作 ， 而 不 会 产生 要 被 其 他 工具 读 取 的 中 间 输 出 文件 。 


3.4 使 用 独立 工具 


我 们 也 可 以 通过 使 用 LLVM 独立 工具 来 练习 之 前 描述 的 编译 工作 流程 ， 这 会 将 一 个 工 
具 的 输出 链接 到 另 一 个 工具 的 输出 。 虽 然 将 中 间 文 件 写 人 磁盘 会 导致 编译 速度 减 慢 ， 但 是 观 
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察 编译 流水 过 程 是 一 个 有 趣 的 教学 练习 。 这 个 过 程 也 让 你 有 机 会 微调 中 间 工 具 的 参数 ， 其 中 
一 些 工具 如 下 : 

opt: 这 是 一 个 旨 在 IR 级 对 程序 进行 优化 的 工具 。 输 入 必须 是 LLVM 位 码 文件 (编码 
的 LLVM IR)， 并 且 生 成 的 输出 文件 必须 具有 相同 的 类 型 。 

e llc: 这 是 一 个 通过 特定 后 端 将 LLVM 位 码 转换 成 目标 机 器 汇编 语言 文件 或 目标 文件 
的 工具 。 你 可 以 通过 传递 参数 来 选择 优化 级 别 、 打 开 调试 选项 以 及 启用 或 禁用 特定 
于 目标 的 优化 。 

llvm-mc: 这 个 工具 能 够 汇编 指令 并 生成 诸如 ELF、MachO 和 PE 等 对 象 格式 的 目 
标 文件 。 它 也 可 以 反 汇编 相同 的 对 象 ， 从 而 转 储 这 些 指令 的 相应 的 汇编 信息 和 内 部 
LLVM 机 器 指令 数据 结构 。 

lli: 这 个 工具 是 LLVM IP 的 解释 器 和 JIT 编译 器 。 

llvm-link: 这 个 工具 将 几 个 LLVM 位 码 链接 在 一 起 ， 以 产生 一 个 包含 所 有 输入 的 


LLVM 位 码 。 
e llvm-as: 该 工具 将 人 工 可 读 的 LLVM IR 文件 ( 称 为 LLVM 汇编 码 ) 转换 为 LLVM 
位 码 。 


e llvm-dis: 这 个 工具 将 LLVM 位 码 解 码 成 LLVM 汇编 码 。 
我 们 来 看 一 个 由 分 散在 多 个 源 文件 中 的 函数 组 成 的 简单 的 C 程序 。 第 一 个 源 文 件 是 
main.c， 它 的 内 容 如 下 : 


#include <stdio.h> 
int sum(int x, int y); 


int main() { 
int r = sum(3, 4); 
printf (lr = %YANn, LE)n 
return 0; 


} 
第 二 个 文件 是 sum.c， 它 的 内 容 如 下 : 


int sum(int x, int y) { 
return x+y; 


} 

我 们 可 以 用 下 面 的 命令 编译 这 个 C 程序 : 

$ clang main.c sum.c -OO Sum 

但 是 ， 我们 使 用 独立 工具 也 可 以 获得 相同 的 结果 。 首 先 ， 我 们 改变 clang 命令 以 便 为 
每 个 C 源 文件 生成 LLVM 位 码 文件 ， 然 后 停 下 来 ， 而 不 是 继续 完成 编译 : 


$ clang -emit-llvm -c main.c -o main.bc 


$ clang -emit-llvm -c sum.c -co sum.bc 


-emit-1lvm 标 志 告 诉 clang 根据 是 否 存 在 -c 或 -s 标志 来 生成 LLVM 位 码 或 LLVM 
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汇编 码 文件 。 在 前 面 的 示例 中 ，-emit-11vm 和 -c 标志 一 起 使 用 ， 将 告诉 clang 以 LLVM 
位 码 格式 生成 一 个 目标 文件 。 使 用 -to -c 标志 组 合 可 以 得 到 相同 的 结果 。 如 果 你 打算 生 
成 人 工 可 读 的 LLVM 汇编 码 ， 请 使 用 下 述 两 个 命令 : 

$ clang -emit-llvm -Ss -c main.c -o main.11 


$ clang -emit-llvm -S -c sum.c -oO sum.11 


” 请 注意 ， 如 果 没 有 -emit-1Llvm 或 -fto 标 志 ， 则 -c 标志 将 生成 一 个 包含 
- 目标 机 器 语言 的 目标 文件 ， 而 -S 将 生成 目标 汇编 语言 文件 。 这 种 行为 与 GCC 
兼容 。 


.bc 和 .11 分 别 是 LLVM 位 码 和 汇编 文件 的 文件 扩展 名 。 为 了 继续 完成 编译 ， 后 续 步 
又 可 以 采取 以 下 两 种 方式 : 
。 从 每 个 LLVM 位 码 文件 生成 特定 于 目标 的 目标 文件 ， 并 通过 将 其 链接 到 系统 链接 髓 
来 构建 可 执行 程序 (图 3-3 的 A 部 分 ): 


llc -filetype=obj main.bc -o main.o 


Vw 


llc -filetype=obj sum.bc -o sum.o 


《7 


clang main.o sum.o -DO sum 


e 首先 ， 将 两 个 LLVM 位 码 文件 连接 成 最 终 的 LLVM 位 码 文件 。 然 后 ， 从 最 终 的 位 码 
文件 构建 特定 于 目标 的 目标 文件 ， 并 通过 调用 系统 链接 程序 来 生成 可 执行 程序 (图 
3-3 的 B 部 分 ): 


llvm-link main.bc sum.bc -o sum.linked.bc 


wy An 


llc -filetype=obj sum.linked.bc -o sum.linked.o 


mr 


clang sum.linked.o -Oo sum 
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clang main.o sum.0 -0 sum 
















main.bc 





B) 


优化 







-emit-llvm 





sum.c sum.bc 





sum.jinked.bc sum.linked.o 
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clang sum.linked.0 -0 sum 
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图 3-3 


-filetype=obj 参数 指定 输出 一 个 目标 文件 ， 而 不 是 目标 汇编 文件 。 我 们 使 用 Clang 
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驱动 程序 clang 来 调用 链接 器 ， 但是， 如果 知道 系统 链接 器 与 系统 库 链接 所 需要 的 所 有 参 
数 ， 则 可 以 直接 使 用 系统 链接 器 。 

通过 在 后 端 调用 (llc) 之 前 链接 IR 文件 ， 将 允许 最 终生 成 的 IR 能够 被 opt 工具 提供 的 
链接 时 优化 机 制 进一步 优化 (请 参阅 第 5 章 )。 另 外 ，lle 工具 可 以 生成 汇编 输出 ， 可 以 使 用 
llvm-mc 对 该 输出 进行 进一步 汇编 。 我 们 将 在 第 6 章 介绍 这 个 接口 的 更 多 细节 。 


3.5 深入 LLVM 内 部 设计 


为 了 将 编译 器 解 耦 成 多 个 工具 ，LLVM 设计 通常 强制 组 件 在 高 度 抽象 层次 上 发 生 交互 。 
它 将 不 同 的 组 件 分 隔 成 不 同 的 库 ， 而 且 它 是 使 用 面向 对 象 的 范例 用 C++ 编写 的 ， 可 以 提供 
可 插入 的 通道 接口 ， 从 而 允许 在 整个 编译 过 程 中 方便 地 集成 转换 和 优化 步骤 。 


3.5.1 了 解 LLVM 的 基本 库 


LLVM 和 Clang 的 工作 逻辑 被 精心 组 织 到 以 下 库 中 : 

e 1ibLLVMCore: 该 库 包 含 与 LLVM IR 相关 的 所 有 逻辑 : IR 构造 (数据 布局 、 指 令 、 
基本 块 和 函数 ) 以 及 IR 校 验 器 。 它 还 负责 编 管理 译 器 中 各 种 编译 流程 。 

e 1ibLLVMRAnalysis : 该 库 包 含 几 个 IR 分 析 过 程 ， 如 别名 分 析 、 依 赖 分 析 、 常 量 折 
全 、 循 环 信息 、 内 存 依赖 分 析 和 指令 简化 。 

e 1ibLLVMCodeGen : 该 库 实现 与 目标 无 关 的 代码 生成 和 机 器 级 别 (LLVM IR 的 更 低 

级 版 本 ) 的 分 析 和 转换 。 

libLLVMTarget: 该 库 通 过 通用 目标 抽象 来 提供 对 目标 机 器 信息 的 访问 接口 。 这 些 

高 级 抽象 为 在 1ibLLVMCodeGen 中 实现 的 通用 后 端 算法 与 为 下 一 个 库 保留 的 特定 

于 目标 的 逻辑 之 间 进 行 通信 提供 网 关 。 

1ibLLVMX86CodeGen : 该 库 具有 特定 于 x86 目标 的 代码 生成 信息 、 转 换 和 分 析 过 

程 ， 它 们 组 成 x86 后 端 。 请 注意 ， 每 个 目标 机 器 都 有 一 个 不 同 的 库 ， 比 如 分 别 实现 

ARM 和 MIPS 后 端的 LLVMARMCodeGen 和 LLVMMipsCodeGen 库 。 

1ibLLVMSupport : 该 库 包 括 一 个 通用 工具 人 集合。 错误、 整数 和 浮 点 处 理 、 命 令 

行 解析 、 调 试 、 文 件 支 持 和 字符 串 处 理 都 是 在 这 个 库 中 实现 的 算法 示例 ， 它 们 在 

LLVM 各 组 件 中 通用 。 

libclang : 该 库 实 现 了 一 个 C 接口 〈 而 不 是 C++ 接口 )， 它 是 LLVM 代码 的 默认 

实现 语言 ， 可 以 访问 Clang 的 大 部 分 前 端 功 能 : 诊断 报告 、AST 遍历 、 代 码 完 成 、 

游标 映射 和 源 代 码 。 由 于 它 使 用 C 语言 ， 使 用 更 简单 的 接口 ， 因 此 它 允 许 以 其 他 

语言 (如 Python) 编写 的 项 目 更 容易 地 使 用 Clang 功能 ， 当 然 C 接口 设计 得 更 为 稳 

定 ， 并 人 允许 外 部 项 目 依 赖 它 。 该 库 仅 涵盖 内 部 LLVM 组 件 所 使 用 的 C++ 接口 的 一 个 

子 集 。 

libclangDriver : 该 库 包含 编译 器 驱动 程序 工具 使 用 的 一 组 类 ， 用 于 理解 类 似 于 

GCC 的 命令 行 参数 ， 以 便 为 外 部 工具 完成 编译 的 不 同步 又 准备 作业 和 组 织 足够 的 参 


数 。 它 可 以 根据 目标 平台 管理 不 同 的 编译 策略 。 

e libclangAnalysis : 该 库 是 由 Clang 提供 的 一 组 前 端 级 分 析 器 。 它 具有 CFG 和 

调用 图 结构 、 代 码 可 达 性 、 格 式 字符 串 安 全 性 等 。 

对 于 如 何 使 用 这 些 库 来 构建 LLVM 工具 ， 我 们 举 了 一 个 例子 ， 图 3-4 显示 llc 工具 对 
libLLVMCodeGen、1ibLLVMTarget 等 库 的 依赖 关系 ， 以 及 这 些 库 对 其 他 库 的 依赖 关系 。 
不 过 请 注意 ， 前 面 的 列表 并 不 完整 。 

我 们 将 把 在 上 面 省 略 的 其 他 库 留 给 后 面 的 章节 去 介绍 。 对 于 版 本 3.0，LLVM 团队 编写 
了 一 个 很 好 的 文档 ， 来 介绍 所 有 LLVM 库 之 间 的 依赖 关系 。 尽 管 文件 已 经 过 时 ， 但 它 仍然 
提供 了 关于 库 的 组 织 关 系 的 有 趣 概 述 ， 可 以 通过 http://llvm.org/releases/3.0/ 
docs/UsingLibraries .html 访问 该 文档 。 


libLLVMBitReader libLLVMCore 


libLLVYMAsmParser 站 libLLVMSupport 


afm th 
libLLVMIRReader 
和 


libLLVMAnalysis 
libLLVMX86CodeGen libLLVMCodeGen 


libLLVMTarget 





图 3-4 


3.5.2 介绍 LLVM 的 C++ 惯例 


LLVM 库 和 工具 都 是 用 C++ 编写 的 ， 以 利用 面向 对 象 的 编程 范例 ， 并 增强 其 各 组 件 之 间 
的 互 操作 性 。 另 外 ， 为 了 尽 可 能 避免 代码 中 的 低 效 性 ， 要 求 强制 执行 良好 的 C++ 编程 惯例 。 

3.5.2.1 在 惯例 中 看 到 多 态 性 

继承 和 多 态 性 通过 将 通用 的 代码 生成 算法 留 给 基 类 来 抽象 后 端的 公共 任务 。 在 这 个 方案 
中 ， 每 个 特定 的 后 端 都 可 以 通过 编写 更 少 的 必要 方法 来 重 写 超 类 泛 型 操作 ， 从 而 专注 于 实 
现 其 特殊 性 。LibLLVMCodeGen 包含 公共 算法 ， 而 LibLLVMTarget 包含 用 于 抽象 单个 
机 器 的 接口 。 以 下 代码 片段 (来 自 llvm/1lib/Target/Mips/MipsTargetMachine.h) 
展示 了 如 何 将 MIPS 目标 机 器 的 描述 类 声明 为 LLVMTargetMachine 类 的 子 类 ， 并 说 明了 
这 个 概念 。 这 段 代 码 是 LLVMMipsCodeGen 库 的 一 部 分 : 


class MipsTargetMachine : public LLVMTargetMachine { 
MipsSubtarget Subtarget; 
const DataLayout DL; 


为 了 进一步 阐述 这 个 设计 选择 ， 我 们 将 展示 另 一 个 后 端 示 例 ， 在 该 例 中 ， 与 目标 无 关 的 
寄存 器 分 配器 〈 它 对 所 有 后 端 都 十 分 常见 ) 需要 知道 哪些 寄存 器 是 保留 的 ， 不 能 用 于 分 配 。 
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这 个 信息 取决 于 具体 的 目标 ， 并 且 不 能 被 编码 成 通用 的 超 类 。 我 们 通过 使 用 MachineReg 
isterInfo: :getReservedRegs() 来 执行 此 任务 ， 这 是 一 个 必须 由 每 个 目标 重 写 的 通 
用 方法 。 以 下 代码 片段 (来 自 llvm/lib/Target/Sparc/SparcRegisterInfo.cpp) 
显示 SPARC 目标 如 何 重 写 此 方法 : 


BitVector SparcRegisterInfo::getReservedRegs(..) const { 
BitVector Reserved (getNumRegs () ) ; 
Reserved.set (SP: :G1); 

Reserved.set (SP: :G2); 


在 此 代码 中 ，SPARC 后 端 通过 构建 位 向 量 来 逐一 选择 哪些 寄存 器 不 能 参加 通用 寄存 器 
分 配 。 

3.5.2.2 ”介绍 LLVM 中 的 C++ 模板 

虽然 LLVM 经 常 使 用 C++ 模板 ， 但 要 特别 小 心 控 制 C++ 项 目的 编译 时 间 ， 因 为 C++ 
项 目 中 典型 的 模板 滥用 问题 会 造成 较 长 编译 时 间 。 一 旦 有 可 能 ，LLVM 就 会 使 用 模板 特 化 
来 允许 实现 快速 和 经 常 使 用 的 任务 。 作 为 LLVM 代码 中 的 一 个 模板 示例 ， 我 们 来 介绍 一 个 
函数 ， 该 函数 检查 作为 参数 传递 的 整数 是 否 适合 给 定 的 位 宽 (模板 参数 ) (代码 来 自 1lvm/ 
include/llvm/Support/MathExtras.h): 


template<unsigned N> 
inline bool isInt(int64 t x) { 


return N >= 64 || 
(- (INT64 C(1)<<(N-1)) <= x && x < (INT64 C(1)<<(N-1))); 


} 


在 这 段 代 码 中 ， 请 注意 模板 中 的 代码 是 如 何 处 理 所 有 位 宽 值 N 的 。 它 有 一 个 较 早 的 比 
较 ， 只 要 位 宽大 于 64 位 就 返回 true， 相 反 则 建立 两 个 表达 式 ， 它 们 是 这 个 位 宽 的 下 限 和 
上 限 ， 以 检查 x 是 否 在 这 两 个 边界 以 内 。 将 此 代码 与 下 面 的 模板 特 化 相 比较 ， 该 模板 用 于 获 
取 位 宽 为 8 这 一 常见 情况 下 更 快 的 代码 : 

lljvm/include/llvm/Support/MathExtras.h: 


template<> 
inline bool isInt<8>(int64 t x) { 
return static cast<int8 t>(x) == x; 


} 


该 代码 将 比较 的 数量 从 三 个 减少 到 一 个 ， 从 而 证 明了 特 化 的 合理 性 。 

3.5.2.3 在 LLVM 中 执行 C++ 最 佳 惯 例 

编程 时 无 意 中 引入 错误 的 现象 是 很 常见 的 ， 问 题 在 于 如 何 管理 错误 。LLVM 理念 建议 
尽 可 能 使 用 在 libLLVMSupport 中 实现 的 断 点 机 制 。 注 意 ， 调 试 编译 器 可 能 特别 困难 ， 因 为 
编译 的 产物 是 另 一 个 程序 。 因 此 ， 如 果 能 够 更 早 检 测 出 错误 的 行为 ， 就 不 需要 为 了 确定 程 
序 是 否 正确 而 编写 一 个 并 不 重要 的 复杂 输出 ， 这 样 ， 就 可 以 节省 大 量 的 时 间 。 例 如 ， 让 我 们 
来 看 一 段 ARM 后 端 代码 ， 它 改变 常量 池 的 布局 ， 从 而 以 跨 函 数 的 几 个 较 小 常量 孤 池 重新 分 
配 它们 。 这 个 策略 通常 用 在 ARM 程序 中 ， 以 便 用 一 个 有 限 (相对 于 PC) 的 寻 址 机 制 来 加 载 
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大 型 常量 ， 因 为 一 个 较 大 的 独立 池 可 能 被 放置 在 距离 使 用 它 的 指令 很 远 的 地 方 。 该 代码 来 
自 llvm/1lib/Target/ARM/ARMConstantIslandPass.cpp,， 我 们 在 下 面 展 示 它 的 一 
部 分 : 
const DataLayout &TD = *MF->getTarget () .getDataLayout (); 
for (unsigned i = 0, e = CPs.size(); i != e; ++i) { 
unsigned Size = TD.getTypeAllocSize (CPs [i] .getType()); 
assert (Size >= 4 && "Too small constant pool entry"); 
unsigned Align = CPs[i] .getAlignment (); 
assert (isPowerOf2 32(Align) && "Invalid alignment"); 
// Verify that all constant pool entries are a multiple of their 
alignment. 
// If not, we would have to pad them out so that instructions 
stay aligned. 
assert ((Size % Align) == 0 && "CP Entry not multiple of 4 
bytes!"); 


在 这 个 片段 中 ,代码 遍历 一 个 代表 ARM 常量 池 的 数据 结构 ， 程 序 员 期 望 这 个 对 象 的 每 
个 字段 都 遵守 特定 的 约束 条 件 。 请 注意 程序 员 如 何 使 用 assert 调用 来 保持 对 数据 语义 的 
控制 。 如 果 程 序 员 在 编写 这 段 代码 的 时 候 发 现 有 什么 内 容 和 自己 的 想法 有 差别 时 ， 程 序 将 立 
即 退 出 执行 ， 并 打印 失败 的 断言 调用 。 程 序 员 在 布尔 表达 式 后 级 &&g"error causel" 的 
习惯 用 法 不 会 影响 assert 的 布尔 表达 式 的 计算 , 但 如 果 失 败 则 会 在 打印 此 表达 式 时 给 出 
关于 断言 失败 的 简短 文本 解释 。 一 旦 LLVM 项 目 执行 发 布 版 本 编译 ， 断 言 对 性 能 的 影响 就 
会 被 完全 删除 ， 因 为 它 会 禁用 断言 。 

你 将 在 LLVM 代码 中 频繁 看 到 的 另 一 种 常见 做 法 是 使 用 智能 指针 。 一 旦 符号 超出 范围 ， 
智能 指针 将 自动 释放 内 存 ， 它 们 在 LLVM 代码 库 中 用 于 (例如) 保持 目标 信息 和 模块 。 过 
去 , LLVM 提供 了 一 个 叫 作 owningPtr 的 特殊 智能 指针 类 ， 它 在 llvm/include/llvm/ 
ADT/OwningPtr.h 中 定义 。 从 LLYM 3.5 开始 ， 这 个 类 已 被 弃 用 ， 而 被 std: :unique_ 
ptz() 替代 ， 这 是 在 C++ 11 标准 中 引入 的 。 

如 果 你 对 LLVM 项 目 中 采用 的 C++ 最 佳 惯 例 的 完整 列表 感 兴趣 ， 请 访问 http:// 
llvm.org/docs/Codingstandards .htm1l。 每 位 C++ 程序 员 都 应 该 读 一 下 。 

3.5.2.4 在 LLVM 中 使 用 轻 量 级 字符 串 引用 

LLVM 项 目 有 一 个 支持 常见 算法 的 数据 结构 扩展 库 ， 在 该 LLVM 库 中 字符 串 有 特殊 的 
地 位 。 它 们 属于 C++ 中 的 一 个 类 ， 并 引发 了 热烈 的 讨论 : 我 们 应 该 在 什么 时 候 使 用 一 个 简 
单 的 char* 而 不 是 C++ 标准 库 的 string 类 ? 要 在 LLVM 的 上 下 文中 讨论 这 个 问题 ， 可 
以 考虑 在 整个 LLVM 库 中 密集 使 用 字符 串 调用 ,来 引用 LLVM 模块 、 函 数 和 值 等 的 名 称 。 
在 某 些 情况 下 ，LLVM 处 理 的 字符 串 可 以 包含 空 字符 ， 但 是 ， 因 为 空 字符 会 终止 C 风格 的 
字符 串 ， 所 以 将 常量 字符 串 引 用 作为 const char* 指针 进行 传递 的 方法 是 不 可 能 的 。 另 
一 方面 ， 频 繁 使 用 const std: :stringg& 会 引入 额外 的 堆 分 配 ， 因 为 string 类 需要 拥 
有 字符 缓冲 区 。 我 们 可 以 从 下 面 的 例子 中 看 到 这 一 点 : 


bool hasComma (const std::string &a) { 


// code 


} 


工具 而 座 矿 jy 


void myfunc() { 


char buffer [40]; 

// code to create our string in our own buffer 

hasComma (buffer); // C++ compiler is forced to create a new 
string object, duplicating the buffer 

hasComma ("hello, world!"); // Likewise 


} 


请 注意 ， 每 次 我 们 尝试 在 自己 的 缓冲 区 中 创建 字符 串 时 ， 都 会 花费 额外 的 堆 分 配 来 将 此 
字符 串 复制 到 string 对 象 的 内 部 缓冲 区 ， 而 该 对 象 必 须 拥 有 自己 的 缓冲 区 。 在 第 一 种 情 
况 下 ， 我 们 有 一 个 堆栈 分 配 的 字符 串 ， 而 在 第 二 种 情况 下 ， 字 符 串 被 当 作 一 个 全 局 常量 。 对 
于 这 种 情况 ，C++ 中 缺少 一 个 简单 的 类 ， 能 够 在 我 们 只 需要 引用 字符 串 时 ， 避 免 不 必要 的 分 
配 。 即 使 我 们 严格 使 用 string 对 象 ， 以 避免 不 必要 的 堆 分 配 ， 但 对 字符 串 对 象 的 引用 也 
会 产生 两 个 间接 引用 。 由 于 string 类 已 经 使 用 一 个 内 部 指针 来 持 有 其 数据 ， 所 以 当 我 们 
访问 实际 数据 时 ， 传 递 字符 串 对 象 的 指针 会 造成 两 次 引用 的 开销 。 

我 们 可 以 利用 一 个 LLVM 类 来 更 加 高 效 地 处 理 字符 串 引 用 : StringRef。 这 是 一 个 
轻 量 级 类 ， 它 可 以 像 const charx* 那样 进行 值 传递 ,但 是 它 也 存储 字符 串 的 大 小 ， 从 而 
允许 空 字 符 的 存在 。 然 而 ,与 string 对 象 不 同 ， 它 并 不 拥有 自己 的 缓冲 区 ， 因 此 永远 不 
会 分 配 堆 空 间 ， 而 只 是 引用 其 外 部 的 字符 串 。 在 其 他 C++ 项目 中 也 涉及 这 个 概念 ， 例 如 ， 
Chromium 使 用 stringPiece 类 来 实现 相同 的 目的 。 

LLVM 还 引入 了 男 一 个 字符 串 操作 类 。 为 了 通过 几 个 连接 构建 一 个 新 的 字符 串 ，LLVM 
提供 了 Twine 类 。 该 类 只 存储 用 来 构成 最 终结 果 的 字符 串 的 引用 ， 通 过 这 种 方式 来 推迟 实 
际 的 连接 。 这 是 在 C++ 11 之 前 创建 的 技术 ， 那 时 字符 串 连接 的 开销 较 高 。 

如 果 你 有 兴趣 了 解 LLVM 为 程序 员 提 供 的 其 他 通用 类 ， 那 么 应 该 保存 在 书签 中 的 一 个 
非常 重要 的 文档 是 LLVM 程序 员 手 册 ， 该 手册 讨论 可 能 对 任何 代码 都 有 用 的 LLVM 通用 数 
据 结 构 。 该 手册 位 于 http://llvm.org/docs/ProgrammersManual.html。 


3.5.3 ”演示 可 插 拔 的 流程 接口 


一 个 流程 (pass) 是 指 一 次 转换 分 析 或 优化 。LLVM API 允许 你 轻松 地 在 程序 编译 生命 
周期 的 不 同 部 分 注册 任何 流程 ， 这 是 LLVM 设计 中 值得 称道 的 亮点 。 流 程 管理 器 用 于 注册 、 
调度 和 声明 流程 之 间 的 依赖 关系 。 因 此 ，PassManager 类 的 实例 在 不 同 的 编译 器 阶段 都 是 
可 用 的 。 

例如 ， 目标 可 以 在 代码 生成 期 间 的 多 个 点 自由 地 应 用 自 定义 优化 ， 例 如 ， 在 寄存 器 
分 配 之 前 和 之 后 ， 或 者 在 汇编 码 生 成 之 前 。 为 了 说 明 这 一 点 ， 我 们 展示 一 个 例子 ， 其 
中 X86 目标 在 汇编 码 生成 之 前 有 条 件 地 注册 一 对 自 定义 流程 (来 自 1ib/Target/X86/ 
X86TargetMachine.cpp): 


bool X86PassConfig: :addPreEmitPass() { 


if (getOptLevel() != CodeGenOpt : :None && getX86Subtarget () . 
hasssE2()) { 
addqPass (createExecutionDependencyFixPass (&X86: :VR128RegClass) ) : 


if (getOptLevel() != CodeGenOpt : :None && 
getX86Subtarget () .padShortFunctions()) { 
addPass (createX86PadShortFunctions()); 


} 


请 注意 后 端 如 何 使 用 特定 目标 信息 来 判断 是 否 应 该 添加 流程 。 在 添加 第 一 个 流程 之 前 ， 
X86 目标 会 检查 它 是 否 支 持 SSE2 多 媒体 扩展 。 对 于 第 二 个 流程 ， 它 会 检查 是 否 有 特别 的 填 
充 请 求 。 

在 图 3-5 中 ，A 部 分 是 一 个 示例 ， 它 展示 了 如 何在 opt 工具 中 插入 优化 流程 ，B 部 分 说 
明代 码 生 成 中 可 以 插入 自 定义 目标 优化 的 几 个 目标 钧 子 。 请 注意 ,插入 点 分 散在 不 同 的 代码 
生成 阶段 。 当 你 编写 第 一 个 流程 并 需要 决定 在 何 处 运行 时 ， 此 图 表 会 非常 有 用 。 第 5 章 会 详 
细 描 述 PassManager 接口 。 
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AddStandardCompilePasses() 
AddStanardLinkPasses() 
CreateGlobalOptimizerPasses() 


AddCodeGenPrepare() 
addPrelSel() 
AddInstSelector() 
AddILPOpts() 





Custom passes can be added via 
command line 


AddPreRegAlloc() 
AddOptimizedRegAlloc() 


AddPostRegAlloc() 





AddPreEmitPass() 
图 3-5 


3.6 编写 你 的 第 一 个 LLVM 项 目 


在 本 节 中 ， 我 们 将 展示 如 何 使 用 LLVM 库 的 编写 你 的 第 一 个 项 目 。 在 前 面 的 章节 中 ， 
我 们 介绍 了 如 何 使 用 LLVM 工具 来 生成 与 程序 相对 应 的 中 间 语 言 文件 ， 即 位 码 文 件 。 现 在 
我 们 将 创建 一 个 程序 ， 该 程序 能 够 读 取 此 位 码 文 件 并 打印 其 中 定义 的 函数 名 称 ， 以 及 它们 的 
基本 块 数量 ， 从 而 显示 LLVM 库 的 易 用 性 。 





3.6.1 编写 Makefile 


链接 LLVM 库 需 要 使 用 长 命令 行 ， 如 果 没 有 构建 系统 的 帮助 ， 想 写 出 这 些 命令 行 是 不 
切实 际 的 。 在 下 面 的 代码 中 ， 我 们 展示 了 一 个 Makefile 文件 (基于 在 DragonEgg 中 使 用 的 
代码 ) 来 完成 这 个 任务 ， 同 时 解释 所 提 到 的 每 个 部 分 。 如 果 复 制 并 粘贴 此 代码 ， 将 会 丢失 
制 表 符 。 请 记 住 ，Makefile 依赖 于 制 表 符 来 指定 定义 规则 的 命令 ， 因 此 ， 应 该 手动 插入 制 
表 符 : 
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LLVM CONFIG?=llvm-config 
ifndef VERBOSE 
QUIET:=@ 


endif 


SRC_ DIR?=$ (PWD) 


LDFLAGS+=$ (shell $ (LLVM CONFIG) --ldflags) 
COMMON FLAGS=-Wall -Wextra 
CXXFLAGS+=$ (COMMON FLAGS) $ (shell $(LLVM CONFIG) --cxxflags) 


CPPFLAGS+=$ (shell $ (LLVM CONFIG) --cppflags) -I$ (SRC DIR) 


第 一 部 分 定义 将 用 作 编 译 器 标志 的 第 一 个 Makefile 变量 。 第 一 个 变量 决定 11vm- 
config 程序 的 位 置 ， 在 这 里 ， 它 需要 在 你 的 路 径 中 。1L1vm-config 工具 是 一 个 LLVM 程序 ， 
它 可 以 打印 构建 需要 与 LLVM 库 链 接 的 外 部 项 目的 各 种 有 用 信息 。 

例如 ， 定 义 在 C++ 编译 器 中 使 用 的 标志 集 时 ， 请 注意 ， 我 们 要 求 Make 启动 1lvm- 
config --cxxflags shell 命令 行 ， 该 命令 行将 打印 用 于 编译 LLVM 项 目的 C++ 标志 集 。 
这 样 ， 我 们 就 使 得 项 目 源码 的 编译 与 LLVM 源码 兼容 。 最 后 一 个 变量 定义 要 传递 给 编译 器 
预 处 理 器 的 标志 集 。 


HELLO=helloworld 
HELLO OBJECTS=hello.o 
default: $ (HELLO) 


%.0 : $(SRC DIR)/%.cpp 
@echo Compiling $*.cpp 
$ (QUIET)S$ (CXX) -c $ (CPPFLAGS) $ (CXXFLAGS) $< 


$ (HELLO) : $ (HELLO OBJECTS) 

@echo Linking $@ 

$ (QUIET) $ (CXX) -o S$@ $ (CXXFLAGS) $ (LDFLAGS) $“ ~“$ (LLVM CONFIG) 
--libs bitreader core support ~ 


在 第 二 个 片段 中 ,我们 定义 了 Makefile 规则 。 第 一 个 规则 总 是 默认 的 ， 我 们 用 它 构建 
hello-world 可 执行 文件 。 第 二 个 是 通用 规则 ， 它 将 所 有 C++ 文件 编译 成 目标 文件 ， 我 们 将 
预 处 理 咒 标志 和 C++ 编译 器 标志 传递 给 它 。 我 们 还 使 用 $(QUIET) 变量 来 省 略 屏幕 上 出 
现 的 完整 命令 行 ， 但 是 如 果 你 想 要 一 个 详细 的 构建 日 志 ， 则 可 以 在 运行 GNU Make 时 定义 
VERBOSE。 

最 后 一 个 规则 链接 所 有 目标 文件 (在 这 里 只 有 一 个 ) 来 构建 与 LLVM 库 链 接 的 项 目 可 执 
行文 件 。 这 部 分 工作 是 由 链接 器 完成 的 ， 但 是 一 些 C++ 标志 也 可 能 会 生效 。 因 此 ， 我 们 将 
C++ 和 链接 器 标志 都 传递 给 命令 行 。 我 们 用 ' command' 结构 来 完成 此 操作 ， 它 指示 shell 
用 'command' 的 输出 替换 这 部 分 内 容 。 在 我 们 的 例子 中 ,命令 是 llvm-config --1Libs 
bitreader core support。--libs 标志 向 1lvm-config 请 求 提供 用 于 链接 到 所 请 求 
的 LLVM 库 的 链接 器 标志 列表 。 这 里 ， 我 们 请 求 1ibLLVMBitReader、1ibLLVMCore 
和 1ibLLVMSupport。 

由 11vm-config 返 回 的 标志 列表 是 一 系列 -1 链接 器 参数 ， 如 -1LLLVMCore 


-1LLVMSupport。 但 请 注意 ， 传 递 给 链接 器 的 参数 顺序 很 重要 ， 并 且 要 求 你 将 依赖 于 其 他 
库 的 参数 放 在 前 面 。 例 如 ， 由 于 1ibLLVMCore 使 用 1ibLLVMSupport 提供 的 通用 功能 ， 
因此 正确 的 顺序 是 -lLLVMCore -1LLVMSupport。 

顺序 很 重要 ， 因 为 一 个 库 就 是 一 个 目标 文件 的 集合 ， 在 将 项 目 与 库 链接 时 ,链接 器 只 选 
择 到 目前 为 止 已 知 的 目标 文件 来 解析 所 见 到 的 未 定义 符号 。 因 此 ， 如 果 它 正在 处 理 命令 行 参 
数 中 的 最 后 一 个 库 ， 并 且 该 库 恰 好 使 用 了 已 经 处 理 过 的 库 中 的 符号 ， 则 大 多 数 链接 器 (包括 
GNU 1d) 将 不 会 返回 去 包括 有 可 能 缺失 的 目标 文件 ， 从 而 导致 构建 失败 。 

如 果 你 想 避 免 这 个 问题 ， 并 强制 链接 器 迭代 访问 每 个 库 ， 直 到 所 有 必要 的 目标 文件 都 被 
解析 ， 则 必须 在 库 列表 的 开始 和 结束 处 使 用 --start-group 和 --end-group 标 志 , 但 
这 可 能 会 减 慢 链接 器 速度 。 在 构建 完整 的 依赖 关系 图 时 ， 为 了 避免 因为 要 弄 清 楚 链接 器 参数 
的 顺序 而 头疼 ， 可 以 简单 使 用 11vm-config --1Libs， 让 它 为 你 做 这 些 工 作 ， 就 像 我 们 之 
前 做 的 那样 。 

Makefile 文件 的 最 后 一 部 分 定义 了 一 条 清理 规则 以 删除 编译 器 生成 的 所 有 文件 ， 使 我 们 
可 以 从 头 开 始 重新 启动 构建 。 清 理 规则 的 格式 如 下 : 


clean:: 
$ (QUIET) rm -f $(HELLO) $ (HELLO OBJECTS) 
3.6.2 ”编写 代码 
下 面 展示 这 个 流程 的 完整 代码 。 它 相对 较 短 ， 因 为 它 建立 在 LLVM 流程 基础 设施 上 ， 
后 者 蔡 我 们 完成 了 大 部 分 工作 。 


#include "llvm/Bitcode/ReaderWriter.h" 
#include "llvm/IR/Function.h" 

#include "llvm/IR/Module.h" 

#include "llvm/Support/CommandLine.h" 
#include "llvm/Support/MemoryBuffer.h" 
#include "llvm/Support/raw_os_ostream.h" 
#include "llvm/Support/system error.h" 
#include <iostream> 


using namespace llvm; 


static cl::opt<std::string> FileName (cl::Positional, cl::desc("Bitcode 
file"), cl::Required); 


int main(int argc, char** argv) { 
cl::ParseCommandLineOptions (argc, argv, "LLVM hello world\n"); 
LLVMContext context; 
std::string error; 
OwningPtr<MemoryBuffer> mb; 
MemoryBuffer: :getFile (FileName, mb); 


Module *m = ParseBitcodeFile(mb.get(), context, &error); 
if (m == 0) { 
std: :cerr << "Error reading bitcode: " << error << std::end; 


return =1; 


} 


raw os ostream Ol(std::cout); 
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for (Module::const iterator i = m->getPunctionList () .begin() ， 
e = m->getFunctionList().end(); i != e; ++i) { 
if (!i->isDeclaration()) { 


O << i->getName() << " has " << i->size() << " basic 
block(s) .\n'"; 
} 
} 


return 0; 


} 


我 们 的 程序 使 用 cl 命名 空间 中 的 LLVM 工具 (cl1 代表 命令 行 ) 来 实现 我 们 的 命令 行 接 
口 。 我 们 只 需 调用 ParseCommandLineOptions 图 数 并 声明 cl: :opt <string> 类 型 的 
全 局 变量 ， 以 显示 我 们 的 程序 接收 单个 参数 ， 并 且 该 参数 是 包含 位 码 文件 名 的 string 类 型 。 

之 后 ， 我 们 实例 化 一 个 LLVMContext 对 象 ， 以 存放 与 LLVM 编译 相关 的 所 有 
数据 ， 从 而 使 LLVM 是 线程 安全 的 。MemoryBuffer 类 为 内 存 块 定义 一 个 只 读 接 口 ， 
ParseBitcodeFile 函数 将 使 用 这 个 对 象 来 读 取 我 们 的 输入 文件 的 内 容 ， 并 解析 文件 中 
LLVM IR 的 内 容 。 在 检查 完 错误 并 确保 一 切 正常 后 ， 我 们 遍历 该 文件 中 模块 的 所 有 函数 。 
LLVM 模块 的 概念 类 似 于 翻译 单元 ， 其 中 包含 所 有 编码 到 位 码 文 件 中 的 内 容 ， 也 是 LLVM 
层次 结构 中 的 最 高 实体 ， 在 它 后 面 是 函数 ， 然 后 是 基本 块 ， 最 后 是 指令 。 如 果 函 数 只 是 一 个 
声明 ， 则 丢弃 它 ， 因 为 我 们 想 查 找 函 数 定义 。 当 我 们 找到 这 些 函 数 定义 时 ， 将 打印 它们 的 名 
称 和 它 包 含 的 基本 块 的 数量 。 

如 果 编 译 此 程序 ， 并 使 用 -help 运行 ， 可 以 查看 已 为 你 的 程序 准备 好 的 LLVM 命令 行 功 
能 。 之 后 ， 查 找 要 转换 为 LLVM IR 的 C 或 C++ 文件 ， 然 后 将 其 转换 并 使 用 程序 进行 分 析 : 


$ clang -c -emit-llvm mysource.c -0o mysource.bc 


$ helloworld mysource.bc 


如 果 要 进一步 了 解 可 从 函数 中 提取 的 内 容 ， 请 参阅 LLVM Doxygen 文档 中 关于 
llvm: :Function 类 的 内 容 ， 网 址 为 http://llvm.org/docs/doxygen/html/classllvm 
_1 1lFunction.html。 作 为 一 个 练习 ， 请 尝试 扩展 这 个 例子 ， 以 打印 每 个 函数 的 参数 
列表 。 


3.7 关于 LLVM 源 代 码 的 一 般 建 议 


在 进一步 学 习 LLVM 实现 之 前 ， 注 意 还 有 一 些 值得 理解 的 要 点 ， 主 要 是 针对 开源 软件 
领域 的 新 程序 员 。 如 果 你 在 公司 内 部 的 一 个 封闭 源 代 码 的 项 目 中 工作 ,那么 你 可 能 会 从 项 目 
中 比 你 年 长 的 程序 员 那 里 得 到 很 多 帮助 ， 并 对 许多 起 初 听 起 来 可 能 很 星 涩 的 设计 决定 有 更 深 
入 的 了 解 。 如 果 遇 到 问题 ， 组 件 的 作者 可 能 愿意 口头 向 你 解释 。 其 好 处 是 ， 在 解释 的 时 候 ， 
他 甚至 可 以 读 懂 你 的 面部 表情 ， 和 弄 清 楚 你 什么 时 候 不 了 解 某 个 特定 的 关键 点 ， 并 调整 他 的 话 
语 来 为 你 提供 一 个 更 合适 的 解释 。 

但 是 ， 由 于 在 大 多 数 社区 项 目 中 人 们 都 是 远程 工作 的 ， 因 此 通常 无 法 进行 面对面 的 沟 
通 。 所 以 ， 开 源 社 区 有 更 大 的 动机 采用 更 强 的 文档 机 制 。 另 一 方面 ， 即 使 是 在 英文 书写 的 文 
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档 中 明确 指出 所 有 的 设计 决定 ， 文 档 本 身 也 可 能 并 不 是 最 让 人 期 符 的 东西 。 大 部 分 文档 中 重 
要 的 部 分 是 代码 本 身 ， 从 这 个 意义 上 说 ， 编 写 清晰 的 代码 是 有 压力 的 ， 因 为 你 还 需要 帮助 其 
他 人 在 没有 英文 文档 的 情况 理解 代码 。 


3.7.1 将 代码 理解 为 文档 

尽管 LLVM 中 最 重要 的 部 分 都 有 相应 的 英文 文档 ， 并 且 我 们 在 本 书 中 也 引用 了 这 些 文 
档 ， 但 我 们 的 最 终 目标 是 让 你 准备 好 直接 阅读 代码 ， 因 为 这 是 深入 了 解 LLVM 基础 结构 的 
先决 条 件 。 我 们 将 为 你 提供 必要 的 基本 概念 ， 以 帮助 你 了 解 LLVM 的 工作 原理 ， 并 且 让 你 
从 理解 LLVM 代码 中 享受 到 乐趣 ， 能 够 在 即使 没有 阅读 英文 文档 或 缺乏 英文 文档 的 情况 下 
读 懂 大 部 分 代码 。 即 使 这 样 做 可 能 是 有 挑战 性 的 ， 但 当 你 开始 这 样 做 的 时 候 ， 你 就 会 更 加 深 
入 地 了 解 这 个 项 目 ， 并 且 越 来 越 有 信心 自己 去 做 一 些 改 变 。 这 样 ， 你 将 成 为 一 名 了 解 LLVM 
内 部 知识 的 程序 员 ， 并 且 可 以 帮助 邮件 列表 中 的 其 他 人 。 


3.7.2 请求 社 区 的 帮助 
电子 邮件 列表 的 存在 提醒 你 ， 你 并 不 是 一 个 人 在 战斗 。 它 们 是 Clang 前 端的 cfe-dev 
列表 和 LLVM 核心 的 11vmdev 列表 。 请 花 点 时 间 从 以 下 地 址 订阅 两 个 列表 : 
e Clang 前 端 开发 人 员 列 表 (http://lists.cs.uiuc.edu/mailman/listinfo/ 
cfe-dev) 
e LLVM 核心 开发 人 员 列 表 (http://lists.cs.uiuc.edu/mailman/listinfo/ 
llvmdev) 
项 目 中 有 很 多 人 在 努力 实现 你 也 感 兴趣 的 事情 ， 所 以 很 有 可 能 你 会 针对 别人 已 经 做 过 的 
事情 提问 。 
在 寻求 帮助 之 前 ， 请 先 自己 动脑 思考 ， 并 尝试 在 没有 帮助 的 情况 下 理解 代码 ， 看 看 自己 
能 飞 得 多 高 ， 并 尽力 拓展 你 的 知识 。 如 果 遇 到 一 些 令 你 感到 困惑 的 事情 ， 可 以 向 列表 发 出 一 
封 电子 邮件 ， 清 楚 说 明 你 已 经 探索 过 这 个 问题 但 没有 结果 ， 然 后 再 寻求 帮助 。 通 过 遵循 这 些 
准则 ， 你 将 有 更 好 的 机 会 获取 问题 的 最 佳 答 案 。 


3.7.3 应 对 更 新 : 使 用 SVN 日 志 作 为 文档 

LLVM 项 目 在 不 断 变化 ， 实 际 上 ， 你 可 能 会 发 现 一 个 非常 常见 的 情况 是 ， 你 经 常 需要 更 
新 LLVM 版 本 ， 并 发 现 充当 与 LLVM 库 接口 的 软件 部 分 出 现 问 题 。 在 尝试 再 次 读 取 代码 以 
查看 其 更 改 情况 之 前 ， 请 使 用 合适 的 代码 修订 版 本 。 

为 了 实际 看 看 这 么 做 如 何 有 效 ， 让 我 们 练习 将 前 端 Clang 从 3.4 更 新 到 3.5。 假 设 你 为 
实例 化 BugType 对 象 的 静态 分 析 器 编写 了 一 段 代 码 : 

BugType *bugType = new BugType ("This is a bug name", 

"This is a bug category name'"); 

这 个 对 象 用 来 生成 你 自己 的 检查 器 (更 多 细节 请 参阅 第 9 章 )， 用 于 报告 特定 种 类 的 错 

误 。 现 在 ， 让 我 们 将 整个 LLVM 和 Clang 代码 库 更 新 到 3.5 版 本 ， 并 编译 这 些 代 码 行 。 我 们 
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将 得 到 以 下 输出 : 


error: no matching constructor for initialization of 
'clang: :ento: :BugType' 
BugType *bugType = new BugType ("This is a bug name", 


入 


发 生 此 错误 是 因为 BugType 构造 阴 数 从 一 个 版 本 更 改 为 男 一 个 版 本 。 如 果 你 很 难 确定 
如 何 使 你 的 代码 适应 新 版 本 ， 则 需要 访问 更 改 日 志 ， 这 是 一 个 重要 的 文档 ， 它 会 记录 特定 时 
期 的 代码 更 改 情况 。 幸 运 的 是 ， 对 于 使 用 代码 修订 系统 的 每 个 开源 项 目 ， 我 们 都 可 以 通过 查 
询 代 码 修订 服务 器 来 获取 影响 特定 文件 的 提交 消息 ， 从 而 轻松 获得 更 改 日 志 。 在 LLVM 的 
情况 下 ， 甚 至 可 以 使 用 浏览 器 通过 http://1llvm.org/viewvc 访问 ViewVC 来 这 样 做 。 

在 这 里 ， 我 们 需要 查看 定义 这 个 构造 方法 的 头 文件 中 有 什么 变化 。 通 过 查看 LLVM 源 代 
人 码 树 ， 可 以 在 include/clang/StaticAnalyzer/Core/BugReporter/BugType.h 
找到 该 文件 。 


< 如 果 你 正在 使 用 文本 模式 的 编辑 器 ， 请 务必 使 用 一 个 能 帮助 你 在 LLVM 源 代 

CQ @ 时 大 的 工具 多 各， 论点 时 间 看 看 如 何在 编辑 器 中 使 用 CTAGS。 你 将 委 
容易 在 LLVM 源 代码 树 中 找到 定义 了 你 感 兴趣 的 类 的 文件 。 如 果 你 固执 地 不 想 
使 用 CTAGS 或 其 他 任何 帮助 浏览 大 型 C/C++ 项 目的 工具 (例如 Visual Studio 
IntelliSense 或 Xcode)， 你 可 以 随时 使 用 诸如 grep -re "keyword" * 这 样 的 
命令 ， 如 果 在 项 目的 根 文件 夹 发 出 该 命令 ， 则 可 以 下 列 出 所 有 包含 该 关键 字 的 文 
件 。 通 过 使 用 智能 关键 字 ， 你 可 以 轻松 找到 定义 文件 。 


要 查看 影响 该 特定 头 文件 的 提交 邮件 ， 可 以 访问 http://LlLvm.org/viewvc/11vm-project/ 
cfe/trunk/include/clang/StaticRnalyzer/Core/BugReporter/BugType . 
h?view=1og， 然 后 将 在 浏览 器 中 看 到 日 志 。 现 在 ， 我 们 看 到 了 在 编写 本 书 时 三 个 月 前 发 生 
的 特定 修订 ， 当 时 LLVM 正在 更 新 到 v3.5: 


Revision 201186 - (view) (download) (annotate) - [select for diffs] 
Modified Tue Feb 11 15:49:21 2014 CST (3 months, 1 week ago) by alexfh 
File length: 2618 byte(s) 

Diff to previous 198686 (colored) 

Expose the name of the checker producing each diagnostic message. 


Summary: In clang-tidy we'd like to know the name of the checker 
producing each diagnostic message. PathDiagnostic has BugType and 
Category fields, which are both arbitrary human-readable strings, but we 
need to know the exact name of the checker in the form that can be used 
in the CheckersControlList option to enable/disable the specific checker. 
This patch adds the CheckName field to the CheckerBase class, and sets it 
in the CheckerManager: :registerChecker() method, which gets them from the 
CheckerRegistry. Checkers that implement multiple checks have to store 
the names of each check in the respective registerXXXChecker method. 


Reviewers: jordan rose, krememek Reviewed By: jordan rose CC: cfe- 
commits 


Differential Revision: http://llvm-reviews.chandlerc.com/D2557 


这 个 提交 邮件 是 非常 全 面 的 ， 解释 了 BugType 构造 函数 改变 的 所 有 原因 : 以 前 ， 用 两 
个 字符 串 实例 化 这 个 对 象 并 不 足以 知道 哪个 检查 器 发 现 了 一 个 特定 的 错误 。 因 此 ， 现 在 必须 
通过 传递 你 的 检查 器 对 象 的 实例 来 实例 化 对 象 ， 该 对 象 将 存储 在 BugType 对 象 中 ， 并 且 可 
以 很 容易 发 现 每 个 错误 是 由 哪个 检查 器 产生 的 。 

现在 ， 我 们 更 改 我 们 的 代码 以 符合 以 下 经 过 更 新 的 接口 。 我 们 假设 这 个 代码 是 作为 
Checker 类 的 函数 成 员 的 一 部 分 运行 的 ， 通 常 在 实现 静态 分 析 器 检查 器 的 情况 下 均 是 如 此 。 
因此 ，this 关键 字 应 该 返回 一 个 Checker 对 象 : 


BugType *bugType = new BugType (this, "This is a bug name", 
"This is a bug category name"); 


3.7.4 结束语 


当 你 听 说 LLVM 项 目 有 很 好 的 文档 资源 时 ， 不 要 指望 能 找到 一 个 精确 描述 所 有 代码 细 
节 的 英文 页 面 。 这 意味 着 ， 当 你 依赖 于 阅读 代码 、 接 口 、 注 释 和 提交 邮件 时 ， 你 将 能 够 理解 
LLVM 项 目 ， 并 跟 进 最 新 的 变化 。 不 要 忘记 通过 练习 修改 源 代 码 去 了 解 原理 ， 这 意味 着 你 需 
要 准备 好 你 的 CTAGS 去 开始 探索 ! 


3.8 总 结 


在 本 章 中 ， 我 们 从 历史 的 视角 向 你 介绍 了 LLVM 项 目 中 使 用 的 设计 决策 ， 并 概述 了 其 
中 最 重要 的 项 目 。 我 们 还 展示 了 如 何以 两 种 不 同 的 方式 使 用 LLVM 组 件 : 首先 ， 使 用 编 
译 器 驱动 程序 ， 这 是 一 个 高 级 工具 ， 可 以 在 单个 命令 中 执行 整个 编译 ; 其 次 ,使 用 单独 的 
LLVM 独立 工具 。 除 了 在 磁盘 上 存储 中 间 结 果 (这 会 减 慢 编译 速度 ) 之 外 ， 这 些 工 具 还 允许 
我 们 通过 命令 行 与 LLVM 库 的 特定 片段 进行 交互 ， 从 而 更 好 地 控制 编译 过 程 ， 它 们 是 了 解 
LLVM 如 何 工作 的 绝 佳 方式 。 我 们 还 展示 了 LLVM 中 使 用 的 几 种 C++ 编码 风格 ， 并 解释 了 
应 该 如 何 对 待 LLVM 代码 文档 ， 以 及 如 何 通 过 社区 寻求 帮助 。 

在 下 一 章 中 ， 我 们 将 详细 介绍 Clang 前 端的 实现 及 其 库 文件 。 
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在 生成 指定 的 机 器 码 之 前 ， 编 译 器 的 前 端 负责 将 源 代码 转换 为 编译 器 的 中 间 表 示 。 由 于 
不 同 的 编程 语言 具有 不 同 的 语法 和 语义 范畴 ， 前端 通常 要 么 处 理 一 种 语言 ， 要 么 处 理 一 组 相 
似 的 语言 。 就 Clang 而 言 ， 它 可 以 处 理 C、C++ 和 Objective-C 源 代码 。 

本 章 介绍 以 下 主题 : 

e 如 何 将 程序 与 Clang 库 链 接 和 使 用 1ibclang 

e Clang 诊断 和 Clang 前 端 阶段 

。 用 1ibclang 的 例子 进行 词法 、 语 法 和 语义 分 析 

e 如 何 使 用 C++ Clang 库 编 写 一 个 简化 的 编译 器 驱动 程序 


4.1 Clang 简介 


Clang 项 目 是 LLVM 官方 框架 中 最 为 人 熟知 的 编译 器 前 端 ， 可 以 支持 C、C++ 和 
Objective-C 编程 语言 。 读 者 可 以 通过 网 址 http://clang.1llvm.org 访问 Clang 的 官方 
网 站 ， 本 书 的 第 1 章 介 绍 了 Clang 的 配置 、 构 建 和 安装 。 

与 LLVM 这 一 名 称 有 多 重 含义 并 会 引起 混淆 相似 ，Clang 也 可 能 意 指 三 种 不 同 实体 : 

1. 前 端 (在 Clang 库 中 实现 )。 

2. 编译 器 驱动 程序 (在 clang 命令 和 Clang 驱动 程序 库 中 实现 )。 

3. 实际 的 编译 器 〈 在 clang -ccl 命令 中 实现 )。clang -ccl 中 的 编译 器 不 仅 是 由 
Clang 库 实现 的 ， 而 且 还 广泛 使 用 其 他 LLVM 库 来 实现 编译 器 的 中 间 部 分 、 后 端 以 及 集成 的 
汇编 器 。 

在 本 章 中 ， 我 们 主要 关注 Clang 库 和 LLVM 的 C 系列 前 端 。 为 了 更 好 地 理解 驱动 程序 
和 编译 器 的 工作 原理 ， 我 们 首先 分 析 clang 编译 器 驱动 程序 的 命令 行 调用 : 


$ clang hello.c -o hello 


在 解析 命令 行 参数 之 后 ，Clang 驱动 程序 通过 使 用 -cc1 选项 来 生成 男 一 个 自身 实例 ， 
以 调用 其 内 部 编译 器 。 通 过 在 编译 器 驱动 程序 中 使 用 -Xxclang<option>， 可 以 将 特定 的 
参数 传递 给 该 命令 行 工 具 。 该 工具 与 驱动 程序 不 同 ， 它 与 GCC 命令 行 的 调用 接口 区 别 较 大 。 
例如 ，clang -ccl 工具 有 一 个 特殊 的 选项 ， 可 打印 Clang 抽象 语法 树 (AST)。 可 以 使 用 
以 下 命令 激活 该 选项 : 

$ clang -Xclang -ast-dump hello.c 


也 可 以 直接 调用 clang -ccl， 而 不 是 驱动 程序 : 


$ clang -ccl -ast-dump hello.c 


这 里 需要 指出 的 是 ， 编 译 器 驱动 程序 的 任务 之 一 是 用 所 有 必要 的 参数 来 初始 化 编译 器 
的 调用 。 使 用 -### 标志 来 运行 驱动 程序 可 以 看 见 它 用 哪些 参数 调用 clang -ccl 编译 髓 。 
例如 ， 如 果 手 动 调用 clang -ccl， 还 需要 通过 -I 标志 来 提供 所 有 系统 头 文件 位 置 。 


4.1.1 前 端 操作 


clang -ccl 工具 的 一 个 重要 特点 (也 是 其 容易 被 混 消 的 地 方 ) 是 它 不 仅 实现 了 编译 右 
的 前 端 ， 而 且 还 通过 LLVM 库 实 例 化 所 有 其 他 LLVM 组 件 ， 以 执行 LLVM 支持 的 所 有 编译 
功能 。 因 此 ， 可 以 说 clang -ccl 几乎 实现 了 完整 的 编译 器 。 

通常 在 编译 目标 是 x86 机 器 码 时 ，clang -ccl 会 在 生成 目标 文件 ( .o 文件 ) 后 停止 
工作 ， 因 为 LLVM 链接 器 仍 处 于 实验 阶段 ， 未 被 集成 。 在 生成 目标 文件 后 ， 控 制 权 被 交还 
给 编译 器 驱动 程序 ， 由 其 调用 外 部 工具 来 链接 整个 项 目 。 

使 用 -### 标志 可 以 显示 由 Clang 驱动 程序 调用 的 程序 列表 ， 如 下 所 示 : 

$ clang hello.c -### 

clang version 3.4 (tags/RELEASE 34/final 211335) 

Target: i386-pc-linux-gnu 

Thread model: posix 


"clang" "-ccl" (...parameters) "hello.c" "-o" "/tmp/hello-dddafcl.o" 
"/usr/bin/ld" (...parameters) "/tmp/hello-ddafcl.o" "-o" "hello" 


我 们 省 略 了 驱动 程序 使 用 的 完整 参数 列表 。 第 一 行 显示 clang -ccl 从 C 源 文件 到 目 
标 代 码 的 编译 和 导出 过 程 ， 最 后 一 行 表明 Clang 仍然 依赖 于 系统 的 链接 器 来 完成 编译 过 程 。 

在 内 部 ， 对 clang -ccl 的 每 个 调用 都 由 一 个 相应 的 主 前 端 操 作 来 控制 。 完 整 的 操作 
集 定义 在 源 文件 ijnclude/clang/Frontend/FrontendOoptions.h 中 。 表 4-1 包含 几 
个 例子 ,描述 了 clang -ccl 工具 可 能 执行 的 各 种 任务 。 





表 4-1 操作 及 说 明 
操作 说 明 操作 说 明 
RSTView 解析 AST 并 在 Graphviz 中 查看 FixIt 解析 任何 Fixit 并 应 用 于 源码 
EmitBC 产生 LLVM 位 码 .bc 文件 PluginAction 运行 一 个 插件 操作 
EmitObj 产生 特定 于 目标 的 .o 文件 RunAnalysis 运行 一 个 或 多 个 源码 分 析 


选项 -ccl 会 触发 ccl_main 函数 的 执行 (要 了 解 详细 信息 ， 可 查看 源码 : tools/ 
driver/ccl main.cpp)。 例如 ， 当 通过 clang hello.c -o hello 来 间接 调用 -ccl 
时 ， 此 函数 会 初始 化 指定 的 目标 机 器 码 的 信息 ， 并 设置 其 诊断 基础 设施 ， 还 会 执行 
Emitobj 操作 。 该 操作 是 在 FrontendAction 的 一 个 子 类 codeGenAction 中 实现 的 。 
该 代码 将 实例 化 所 有 Clang 和 LLVM 组 件 ， 并 协调 指挥 这 些 组 件 构建 目标 文件 。 

不 同 前 端 操作 的 存在 使 Clang 除了 可 以 执行 整个 编译 过 程 之 外 ， 还 可 以 执行 诸如 静态 
分 析 之 类 的 其 他 编译 阶段 。 通 过 -target 命令 行 参数 ， 可 以 为 clang 指定 编译 目标 ， 根 


据 不 同 的 编译 目标 ，clang 加 载 不 同 的 mooLchain 对 象 ， 并 执行 和 编译 目标 对 应 的 前 端 
操作 ， 使 用 相应 的 外 部 工具 完成 编译 过 程 。 例 如 ， 某 个 目标 机 器 码 可 以 使 用 GNU 汇编 器 和 
GNU 链接 器 完成 编译 ， 而 另 一 个 可 以 使 用 LLVM 集成 汇编 器 和 GNU 链接 器 。 关 于 Clang 
对 目标 使 用 哪些 外 部 工具 ， 如 果 读 者 有 疑问 ， 可 以 随时 使 用 -### 来 打印 驱动 程序 命令 。 我 
们 将 在 第 8 章 讨论 有 关 不 同 目标 的 更 多 内 容 。 


4.1.2 库 


从 这 里 开始 ， 我 们 主要 阐述 作为 编译 器 前 端的 Clang 中 所 包含 的 一 系列 库 ， 暂 时 忽略 其 
作为 驱动 程序 和 编译 器 应 用 程序 的 部 分 。 在 这 个 意义 上 ，Clang 被 设计 成 由 几 个 库 组 成 的 模 
块 化 结构 。libclang (http://clang.llvm.org/doxygen/group_CINDEX.html) 
是 提供 给 外 部 Clang 用 户 的 最 重要 的 接口 之 一 ， 它 通过 C API 提供 强大 的 前 端 功能 。 它 包括 
几 个 Clang 库 ， 这 些 库 也 可 以 单独 使 用 并 一 起 链接 到 用 户 自己 的 项 目 中 。 

与 本 章 最 相关 的 库 的 列表 如 下 : 

e 1ibclangLex: 该 库 用 于 预 处 理 和 词法 分 析 ， 处 理 宕 、 令 牌 和 pragma 构造 。 

e 1ibclangAST: 该 库 为 构建 、 操 作 和 遍历 抽象 语法 树 (AST) 增加 了 其 他 功能 。 
libclangParse: 该 库 用 于 使 用 词法 分 析 阶 段 的 结果 进行 逻辑 解析 。 
libclangSema: 该 库 用 于 语义 分 析 ， 语 义 分 析 为 AST 验证 提供 操作 。 
libclangCodeGen: 该 库 使 用 编译 目标 的 信息 来 生成 LLVM IR 代码 。 
libclangAnalysis: 该 库 包 含 用 于 静态 分 析 的 资源 。 
libclangRewrite : 该 库 用 于 支持 代码 重 写 ， 并 为 构建 代码 重 构 工具 提供 基础 架 
构 (第 10 章 将 提供 更 多 细节 )。 

e libclangBasic : 该 库 提供 一 组 实用 程序 ， 包括 内 存 分 配 抽象 、 源 代码 位 置 和 诊 

断 等 。 

使 用 libclang 

本 章 将 通 篇 介绍 Clang 前 端的 各 个 部 分 ， 并 使 用 1ibclang C 接口 给 出 示例 。 即 使 它 
不 是 能 直接 访问 Clang 内 部 类 的 C++ API, 但 它 的 一 大 优点 是 其 稳定 性 。 由 于 许多 用 户 依赖 
该 API，Clang 团队 在 设计 时 考虑 到 了 与 之 前 版 本 的 向 后 兼容 性 。 但 是 ， 除 了 使 用 该 C 接口 ， 
用 户 还 可 以 随时 使 用 常规 C++ LLVM 接口 ， 就 像 在 第 3 章 的 示例 中 使 用 常规 C++ LLVM 接 
口 读 取 位 码 函 数 名 称 一 样 。 

在 你 的 LLVM 安装 文件 夹 中 ， 需 要 检查 在 include 子 目 录 下 是 否 有 clang-c 子 文件 
来， 这 是 1ibclang C 头 文件 所 在 的 位 置 。 在 运行 本 章 的 例子 之 前 ， 需 要 包含 Index .h 头 
文件 (Clang C 接口 的 主人 口 点 )。 最 初 ， 开 发 人 员 创 建 这 个 接口 是 为 了 帮助 诸如 Xcode 这 样 
的 集成 开发 环境 实现 C 源 文件 导航 、 代 码 快 速 修 复 、 代 码 完 成 和 索引 等 功能 ， 这 也 是 主 头 
文件 命名 为 Index.h 的 原因 。 我 们 还 将 在 本 章 最 后 说 明 如 何 使 用 Clang 与 C++ 接口 。 

在 第 3 章 的 示例 中 ， 我 们 使 用 11vm-config 来 构建 LLVM 库 列表 。 与 该 示例 不 同 ， 
Clang 库 没有 类 似 的 工具 。 读 者 可 以 将 第 3 章 中 的 Makefile 更 改 为 以 下 列表 来 链接 到 
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libclang。 与 上 一 章 相同 ,请 记 住 手动 插入 制 表 符 ， 以 确保 Makefile 正常 工作 。 这 是 
一 个 通用 的 Makefile 例子 ， 因 此 请 注意 11vm-config --libs 的 调用 未 使 用 任何 参数 ， 
这 将 返回 完整 的 LLVM 库 列表 。 


LLVM_CONEFIG?=11vm-config 


ifndef VERBOSE 
QUIET:=@ 
endif 


SRC_DIR?=$ (PWD) 

LDFLAGS+=$ (shell $ (LLVM CONFIG) --ldflags) 

COMMON FLAGS=-Wall -Wextra 

CXXFLAGS+=$ (COMMON FLAGS) $ (shell $ (LLVM CONFIG) --cxxflags) 
CPPFLAGS+=$ (shell $ (LLVM CONFIG) --cppflags) -I$ (SRC DIR) 


CLANGLIBS = \ 
-Wl,--start-group\ 
-lclang\ 
-lclangFrontend\ 
-lclangDriver\ 
-lclangSerialization\ 
-lclangParse\ 
-lclangSema\ 
-lclangAnalysis\ 
-lclangEdit\ 
-lclangAsT\ 
-lclangLex\ 
-lclangBasic\ 
-Wl,--end-group 


LLVMLIBS=$ (shell $ (LLVM CONFIG) --libs) 
PROJECT=myproject 
PROJECT OBJECTS=project.o 


default: $ (PROJECT) 


.0 : $(SRC DIR)/%.cpp 
@echo Compiling $*.cpp 
$ (QUIET)$ (CXX) -c $ (CPPFLAGS) $ (CXXFLAGS) $< 


$ (PROJECT) : $ (PROJECT OBJECTS) 
@echo Linking $@ 


$ (QUIET) $ (CXX) -o $@ $ (CXXFLAGS) $ (LDFLAGS) $~ $ (CLANGLIBS) 
$ (LLVMLIBS) 


clean:: 
$ (QUIET)rm -f $(PROJECT) $ (PROJECT OBJECTS) 


如 果 你 正在 使 用 动态 库 并 将 LLVM 安装 在 非 默认 位 置 ， 请 记 住 ， 除 了 配置 PATH 环境 
变量 之 外 ， 动 态 链 接 器 和 加 载 程序 还 需要 知道 LLVM 共享 库 的 安装 位 置 。 否 则 ， 当 运行 项 
目 时 ， 如 果 项 目 存在 共享 链接 库 ， 它 将 找 不 到 所 请 求 的 共享 链接 库 。 

请 以 下 列 方式 配置 库 路 径 : 
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$ export 
LD LIBRARY PATH=$ (LD LIBRARY PATH):/your/llvm/installation/lib 


请 用 你 的 LLVM 完整 安装 路 径 替 代 这 里 的 /your/1llvm/installation/1l1ib。 


4.1.3 理解 Clang 诊断 


诊断 是 编译 器 与 其 用 户 交互 的 重要 部 分 。 诊 断 是 编译 器 向 用 户 发 出 的 信息 ， 以 指示 错 
误 、 警 告 或 建议 。Clang 有 非常 好 的 编译 诊断 功能 ， 能 打印 可 读 性 很 好 的 C++ 错误 报告 。 
在 其 内 部 ，Clang 按照 种 类 来 划分 诊断 信息 : 每 个 不 同 的 前 端 阶段 有 不 同 的 种 类 及 其 对 应 
的 诊断 集 。 例 如 ， 在 include/clang/Basic/DiagnosticParseKinds .td 文件 中 ， 
Clang 定义 了 解析 阶段 的 相关 诊断 信息 。 

Clang 还 根据 问题 的 严重 性 对 诊断 进行 分 类 ， 分 为 五 类 : NOTE 、WRRNING 、EXTENSION、 
EXTWARN 和 ERROR。 这 些 不 同 的 严重 性 通过 枚 举 类 型 Diagnostic: :Level 来 表示 。 

通过 在 文件 include/clang/Basic/Diagnosticx*Kinds .td 中 添加 新 的 TableGen 
定义 ， 并 增加 用 于 检查 对 应 的 触发 条 件 的 代码 ， 可 以 引入 新 的 诊断 。LLVM 源 代码 中 所 
有 .td 文件 都 是 使 用 TableGen 语言 编写 的 。 

在 LLVM 的 编译 系统 中 ， 有 些 编译 工作 是 机 械 重 复 的 ， 因 此 LLVM 使 用 TableGen 这 
一 工具 为 这 些 机 械 重 复工 作 自 动 生成 C++ 代码 。 该 工具 的 想法 来 源 于 LLVM 后 端 ， 因 为 
LLVM 后 端 有 大 量 可 以 基于 对 编译 目标 机 器 的 描述 而 生成 的 代码 ， 现 在 该 想法 被 用 到 整个 
LLVM 项 目 中 。TableGen 的 设计 目的 在 于 通过 记录 这 一 直观 的 数据 结构 来 表示 信息 。 例 如 ， 
DiagnosticParseKinds .td 文件 包含 用 于 表示 诊断 信息 的 记录 的 定义 : 


def err invalid sign spec : Error<"'%0' 
cannot be signed or unsigned">; 
def err invalid short spec : Error<"'short %0' is invalid">; 


在 此 示例 中 ，def 是 用 于 定义 新 记录 的 TableGen 关键 字 。 在 这 些 记 录 结 构 中 ， 哪 些 字 
段 是 必需 的 完全 取决 于 所 使 用 的 TableGen 后 端 ， 并 且 一 种 生成 文件 的 类 型 对 应 一 个 特定 的 
后 端 。TableGen 的 输出 始终 是 一 个 .inc 文件 ， 该 文件 可 以 作为 头 文件 加 入 其 他 LLVM 源 
文件 中 。 在 上 述 例子 中 ，TableGen 需要 生成 DiagnosticsParseKinds.inc 文件 ,并 通 
过 宏 定义 来 解释 每 个 诊断 。 

err invalid sign spec 和 err invalid short spec 是 记录 标识 符 ， 而 Error 
是 一 个 TableGen 类 。 请 注意 ， 这 里 的 语义 与 C++ 略 有 不 同 ， 也 不 一 一 对 应 于 C++ 实体 。 与 
C++ 不同 ， 每 个 TableGen 类 都 是 一 个 记录 模板 ， 用 于 定义 其 他 记录 可 以 继承 的 信息 字段 。 
然而 ， 与 C++ 一 样 ，TableGen 也 有 类 的 层次 结构 。 

类 似 于 模板 的 语法 用 于 基于 Error 类 指定 这 些 定 义 的 参数 ， 该 Error 类 接收 单个 字符 
串 作为 参数 。 从 该 类 派生 的 所 有 定义 都 是 类 型 为 ERROR 的 诊断 信息 ， 并 且 该 特定 信息 被 编 
码 在 类 参数 中 , 例如 "'short %0' is invalid"。 虽 然 TableGen 的 语法 非常 简单 ， 但 
由 于 TableGen 条 目 中 编码 的 信息 量 很 大 ， 可 能 会 让 读者 感到 困惑 。 如 果 理 解 有 困难 ， 请 参 
考 http://llvm.org/docs/TableGen/LangRef .html。 
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读 取 Clang 诊断 信息 
这 里 我 们 提供 一 个 C++ 示例 ， 它 使 用 1ibclang C 接口 读 取 和 转 储 Clang 在 读 取 给 
源 文件 时 产生 的 所 有 诊断 信息 。 


extern "C" { 

#include "clang-c/Index.h" 

} 

#include "llvm/Support/CommandLine.h" 
#include <iostream> 


using namespace llvm; 


static cl::opt<std::string> 
FileName (cl::Positional, cl::desc("Input file"), cl::Required); 


int mainl(lint argc, char** argv) 
{ 
cl::ParseCommandLineOptions (argc, argv, "Diagnostics Example"); 
Cxindex index = clang createIndex(0, 0); 
const char *args[] = { 
"-I/usr/include", 
WI" 
}s 
CxXTranslationUnit translationUnit = clang parseTranslationUnit 
(index, FileName.c str(), args, 2, NULL, 0, 
CxTranslationUnit None); 
unsigned diagnosticCount = clang getNumDiagnostics (translationUnit); 
for (unsigned i = 0; i < diagnosticCount; ++i) { 
CXDiagnostic diagnostic = clang getDiagnostic(translationUnit, i); 
CXString category = clang getDiagnosticCategoryText (diagnostic); 
CXString message = clang getDiagnosticSpelling (diagnostic); 
unsigned severity = clang getDiagnosticSeverity (diagnostic); 
CXSourceLocation loc = clang getDiagnosticLocation(diagnostic); 
CxString fName; 
unsigned line = 0, col = 0; 
clang getPresumedLocation(loc, &fName, &line, &col); 
std::cout << "Severity: " << severity << " File: " 
<< clang getCString (EName) << " Line: " 
< ine < ™ Cols ™ ee BOL x Categorys Nos 
<< clang getCSstring (category) << "\" Message: " 
<< clang getCSstring (message) << std::endl,; 
clang disposeString (fName); 
clang disposeString (message); 
clang disposeString (category); 
clang disposeDiagnostic(diagnostic); 
} 
clang disposeTranslationUnit (translationUnit); 
clang disposeIndex (index); 
return 0; 


在 将 Libclang C 头 文 件 包 含 进 该 C++ 源 代码 之 前 ， 我 们 使 用 extern "C" 环境 来 允 
许 C++ 编译 器 将 该 头 文件 编译 为 C 代码 。 
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我 们 重复 使 用 上 一 章 提 到 的 cl 命名 空间 来 帮助 解析 程序 的 命令 行 参 数 。 然 后 使 用 
libclang 接口 中 的 几 个 函数 (http://clang.llvm.org/doxygen/group CINDEX. 
html )。 

首先 ， 我 们 通过 调用 clang_createIndex() 函数 创建 一 个 索引 ( 它 是 libclang 
使 用 的 顶层 上 下 文 结 构 )。 该 索引 接收 两 个 整数 编码 的 布尔 值 作为 参数 : 如 果 要 从 预 编译 头 
文件 ( PCH ) 中 排除 声明 ， 则 第 一 个 参数 为 真 ; 如 果 要 显示 诊断 ， 则 第 二 个 参数 为 真 。 因 为 
我 们 想 自己 显示 诊断 信息 ， 所 以 将 两 个 参数 都 设 为 false (0 )。 

接 下 来 ， 我们 要 求 Clang 通过 clang _parseTranslationUnit() (参见 http:// 
clang.llvm.org/doxygen/group CINDEX TRANSLATION UNIT.html) 解析 
翻译 单元 。 它 接收 要 解析 的 源 文件 的 名 称 作为 参数 (通过 检索 FileName 全 局 变量 )。 此 变 
量 与 用 来 启动 工具 的 字符 串 参数 相对 应 。 此 外 ， 我 们 还 需要 指定 用 来 指示 include 文件 位 
置 的 两 个 参数 ， 你 可 以 自由 调整 这 些 参数 以 适应 自己 的 系统 。 


< 要 实现 自己 的 Clang 工具 ， 最 难 的 部 分 在 于 缺乏 驱动 程序 的 参数 猜测 能 力 ，Clang 
提供 了 足够 的 参数 来 处 理 系统 中 的 源 文件 。 但 如 果 你 正在 创建 一 个 Clang 插件 ， 
那 就 不 用 担心 了 。 要 解决 这 个 问题 ， 可 以 使 用 第 10 章 中 讨论 的 编译 命令 数据 库 ， 
该 数据 库 给 出 了 用 于 处 理 要 分 析 的 每 个 输入 源 文件 的 准确 参数 集 。 在 这 种 情况 下 ， 
我 们 可 以 使 用 CMake 生成 此 数据 库 。 但 是 ， 在 本 书 的 例子 中 ， 我 们 自己 提供 这 些 
参数 。 


在 解析 所 有 信息 ， 并 将 这 些 信息 放 进 CXxTranslationUnit C 数据 结构 之 后 ， 我 们 将 
通过 实现 一 个 循环 来 遍历 Clang 生成 的 所 有 诊断 信息 ， 并 将 其 转 储 到 屏幕 。 为 此 ， 我 们 首先 
使 用 clang_getNumDiagnostics() 来 检索 解析 此 文件 时 生成 的 诊断 信息 的 数目 ， 并 确 
定 循环 的 边界 (参见 http://clang.llvm.org/doxygen/group CINDEX DIAG. 
html )。 

之 后 ， 对 于 每 一 个 循环 迭代 ， 我们 用 clang_getDiagnostic() 检索 当前 的 诊断 ， 用 
clang getDiagnosticCategoryText() 检索 描述 此 诊断 类 型 的 字符 串 ,， 用 clang_ 
getDiagnosticSpelling() 检索 要 向 用 户 展示 的 消息 ,用 clang_getDiagnostic 
Location( ) 检索 诊断 发 生 时 准确 的 代码 位 置 。 我 们 还 使 用 clang_getDiagnosticSeverity() 
来 检索 表示 诊断 严重 性 的 各 种 情况 (NOTE、WARNING、EXTENSION、EXTWARN 或 ERROR ) 。 
但 为 了 简单 起 见 ， 我 们 将 其 转换 成 无 符号 值 ， 并 将 其 打印 为 数字 。 

由 于 这 是 一 个 缺少 C++ 字符 串 类 的 C 接口 ， 当 处 理 字 符 串 时 ， 函 数 通常 会 返回 一 个 特 
殊 的 CXString 对 象 ， 该 对 象 需要 调用 clang_getCString() 来 访问 内 部 char 指针 以 
便 将 其 打印 出 来 ， 之 后 用 clang_disposeString() 删除 它 。 

请 记 住 ， 你 输入 的 源 文件 可 能 包括 其 他 文件 ， 这 就 需要 诊断 引擎 同时 记录 除 行 和 列 之 外 
的 文件 名 。 三 重 属性 集 (文件 、 行 和 列 ) 允许 你 定位 要 引用 代码 的 哪 一 部 分 。 一 个 特殊 的 对 
象 cxSourceLocation 用 来 表示 这 个 三 重 属性 集 。 要 将 其 转换 为 文件 名 、 行 和 列 号 ， 必 


须 使 用 clang_getPresumedLocation() 函数 ， 并 将 CXString 和 int 作为 按 引 用 传 
递 的 参数 进行 相应 填充 。 

完成 后 ， 通过 clang disposeDiagnostic()、clang disposeTranslationUnit() 
和 clang_disposeIndex( ) 删除 对 象 。 

下 面 让 我 们 用 hello.c 文件 测试 一 下 : 


int main() { 
printf ("hello, world!\n") 
} 
这 个 C 源 文 件 有 两 个 错误 : 缺少 正确 的 头 文件 ， 缺 少 分 号 。 下 面 我 们 构建 自己 的 项 目 ， 
并 运行 它 来 查看 Clang 将 为 我 们 提供 哪些 诊断 信息 : 
$ make 


$ ./myproject hello.c 

Severity: 2 File: hello.c Line: 2 Col: 9 Category: "Semantic Issue" 
Message: implicitly declaring library function 'printf' with type 'int 
(const char *, ...)' 


Severity: 3 File: hello.c Line: 2 Col: 24 Category: "Parse Issue" 
Message: expected ';' after expression 


我 们 看 到 这 两 条 诊断 信息 是 由 前 端的 不 同 阶段 产生 的 ， 涉 及 语义 和 解析 (语法 )， 我 们 
将 在 下 一 节 深入 探讨 每 个 阶段 。 
4.2 Clang 前 端 阶段 介绍 


要 将 源 代 码 转 换 为 LLVM IR 位 码 ， 源 代码 必须 经 过 几 个 中 间 步 又 。 图 4-1 说 明了 这 些 
步骤 ， 它 们 也 是 本 节 的 主题 。 





前 端 (Clang ) 


语义 分 析 LLVM IR 生 成 器 


Objective-C 源 代码 





4.2.1 词法 分 析 


前 端的 第 一 个 步骤 负责 处 理 源 代码 的 文本 输入 ， 具 体 来 说 是 将 语言 结构 拆 分 成 一 组 单 
词 和 记号 ， 并 删除 诸如 注释 、 空 格 和 制 表 符 之 类 的 字符 。 每 个 单词 或 记号 都 必须 是 编程 语 
言 子 集 的 一 部 分 ， 并 且 保 留 关键 字 会 被 转换 为 内 部 编译 器 表示 形式 。 保 留 关 键 字 被 定义 在 
include/clang/Basic/TokenKinds .def 中 。 例 如， 下 面 的 TokenKinds .def 摘录 
内 容 显示 了 C/C++ 语言 常用 的 while 保留 字 和 < 符号 的 定义 : 


TOK (identifier) // abcdae123 
// C++11 String Literals. 
TOK(utf32 string literal) // U"foo" 
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PUNCTUATOR (r_paren, | 


PUNCTUATOR (1_brace, Wh) 
PUNCTUATOR (r_brace, mip) 
PUNCTUATOR (starequal, Vn) 
PUNCTUATOR (plus, w+") 
PUNCTUATOR (plusplus, n++") 
PUNCTUATOR (arrow, ->") 
PUNCTUATOR (minusminus, n=) 
PUNCTUATOR (less, un) 

KEYWORD (float ， KEYALL) 
KEYWORD (goto ,， KEYALL) 
KEYWORD (inline , KEYC99 |KEYCXX |KEYGNU) 
KEYWORD (int , KEYALL) 
KEYWORD (return , KEYALL) 
KEYWORD (short / KEYALL) 
KEYWORD (while , KEYALL) 


该 文件 上 的 定义 会 填充 tok 命名 空间 ， 这 样 ， 无 论 编译 器 何 时 需要 在 词法 处 理 后 检查 
保留 字 是 否 存在 ， 都 可 以 通过 使 用 该 命名 空间 来 访问 它们 。 例 如 ，{、<、goto 和 while 
构造 被 枚 举 元 素 tok: :1_brace、tok::1less、tok::kw_ goto 和 tok::kw_ while 
访问 。 

以 下 面 min.c 文件 中 的 C 代码 为 例 : 


int min(int a, int b) { 
二 本 
return a; 
return b; 


} 


每 个 记号 包含 一 个 SourceLocation 类 的 实例 ， 用 于 表示 程序 源 代码 中 的 一 个 位 置 。 
请 记 住 ,虽然 C 使 用 对 应 的 CXSourceLocation, 但 二 者 都 指 的 是 相同 的 数据 。 我 们 可 
以 使 用 以 下 clang -ccl 命令 行 输出 词法 分 析 中 的 所 有 记号 及 其 SourceLocation 结果 : 


$ clang -ccl -dump-tokens min.c 


例如 ， 前 面 加 粗 显示 的 if 语句 的 输出 结果 为 : 


if 'if' [StartOofLine] [LeadingSpace] Loc=<min.c:2:3> 


1 paren '(' [LeadingSpace] Loc=<min.c:2:6> 

identifier 'a' Loc=<min.c:2:7> 

less '<' [LeadingSpace] Loc=<min.c:2:9> 

identifier 'b' [LeadingSpace] Loc=<min.c:2:11> 

r paren ')' Loc=<min.c:2:12> 

return 'return' [StartOfLine] [LeadingSpace] Loc=<min.c:3:5> 
identifier 'a' [LeadingSpace] Loc=<min.c:3:12> 

semi ';'!' Loc=<min.c:3:13> 


请 注意 ， 每 个 语言 结构 的 前 缀 都 是 它 的 类 型 :“ )” 的 前 级 是 r+_paren,“<” 的 前 缀 是 
less,， 不 匹配 保留 字 的 字符 串 的 前 级 是 identifier， 等 等 。 

4.2.1.1 演示 词法 错误 

下 面 以 lex-err .c 源 代码 为 例 : 


int a = 08000; 


上 述 代码 的 错误 在 于 八进制 常数 的 拼写 错误 : 一 个 八进制 常数 不 能 超过 七 位 数字 ， 这 会 
触发 下 述 语法 错误 : 
$ clang -c lex.c 


lex.c:1:10: error: invalid digit '8' in octal constant 


int a = 08000; 


和 


1 error generated. 


现在 ,我 们 运行 一 个 前 在 提 到 的 相同 例子 : 


$ ./myproject lex.c 


Severity: 3 File: lex.c Line: 1 Col: 10 Category: "Lexical or 
Preprocessor Issue" Message: invalid digit '8' in octal constant 


可 以 看 到 ， 在 这 里 我 们 的 项 目 将 它 定义 成 一 个 词法 问题 ， 这 正 是 我 们 所 希望 看 到 的 。 

4.2.1.2 ”编写 使 用 词法 分 析 器 的 libclang 代码 

下 面 展示 的 例子 使 用 1ibclang 中 的 LLVM 词法 分 析 器 来 产生 源 代码 文件 的 前 60 个 
字符 流 对 应 的 记号 : 


extern "C" { 

#include "clang-c/Index.h" 

} 

#include "llvm/Support/CommandLine.h" 
#include <iostream> 


using namespace llvm; 


static cl::opt<std::string> 
FileName (cl::Positional ,cl::desc("Input file"), 
cl::Required); 


int main(int argc, char** argv) 
| 
cl::ParseCommandLineOptions (argc, argv, "My tokenizer\n"); 
CXIndex index = clang createIndex(0,0); 
const char *args[] = { 
"-I/usr/include", 
WT." 
3 
CxXTranslationUnit translationUnit = clang_ 
parseTranslationUnit (index, FileName.c str(), 
args, 
2, NULL, 0, CxXxTranslationUnit None); 
CxFile file = clang getFile(translationUnit, FileName.c str()); 
CXSourceLocation loc start = clang getLocationForOffset 
(translationUnit, file, 0); 
CXSourceLocation loc end = clang getLocationForOffset 
(translationUnit, file, 60); 
CXSourceRange range = clang getRange (loc start, loc end); 
unsigned numTokens = 0; 
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CXToken *tokens = NULL; 
clang tokenize (translationUnit, range, &tokens, &numTokens); 
for (unsigned i = 0; i < numTokens; ++i) { 
enum CXTokenKind kind = clang getTokenKind (tokens[i]); 
CXxString name = clang getTokenSpelling (translationUnit, 
tokens [i] ) ; 
switch (kind) { 
case CXToken Punctuation: 
std::cout << "PUNCTUATION(" << clang getCstring(name) << ") "; 
break,; 
case CXToken Keyword: 
std::cout << "KEYWORD(" << clang getCstring(name) << ") "; 
break; 
case CXToken Identifier: 
std::cout << "IDENTIFIER(" << clang getCstring(name) << ") "; 
break; 
case CXToken Literal: 
std::cout << "COMMENT(" << clang getCString (name) << ") "; 
break; 
default: 
std::cout << "UNKNOWN(" << clang getCString (narme) << ") "; 
break; 


} 


clang disposeString (name) ; 


} 

std::cout << std::endl; 

clang disposeTokens (translationUnit, tokens, numTokens); 
clang disposeTranslationUnit (translationUnit); 

return 0; 


} 


为 了 顺利 构建 上 述 代 码 ， 我 们 先 用 相同 的 样板 代码 初始 化 命令 行 参数 ， 并 调用 上 一 个 例 
子 中 的 clang_createIndex() 和 clang parseTranslationUnit()。 与 之 前 例子 
的 不 同 之 处 在 于 ， 这 里 我 们 不 需要 查询 诊断 信息 ， 而 是 准备 clang_tokenize() 函数 的 
参数 ， 该 函数 将 运行 Clang 词法 分 析 器 并 为 我 们 返回 一 个 记号 流 。 为 此 ， 我 们 必须 构建 一 个 
CXSourceRange 对 象 ， 来 指定 要 运行 词法 分 析 器 的 源 代码 范围 (起 始 地 址 和 结束 地 址 )。 
该 对 象 可 以 由 两 个 CXSourceLocation 对 象 组 成 ， 分 别 对 应 起 始 地 址 和 结束 地 址 。 我 们 
可 以 使 用 clang_getLocationForoffset() 创建 它们 ， 对 于 使 用 clang_getFilel() 
获取 的 CXFile， 该 方法 将 返回 CXSourceLocation 对 象 以 表示 其 具体 的 偏 移 量 。 

要 通过 两 个 CXSourceLocation 对 象 构建 CXSourceRange 对 象 ， 需 要 使 用 clang 
getRange() 函数 。 通 过 该 函数 ， 可 以 用 两 个 通过 引用 传递 的 重要 参数 来 调用 clang__ 
tokenize()。 两 个 参数 分 别 为 : 一 个 是 指向 CXToken 的 指针 ， 它 将 存储 记号 流 ; 另 一 个 
是 能 够 返回 流 中 记号 数量 的 无 符号 类 型 。 根 据 这 个 数量 ， 就 可 以 构建 一 个 循环 结构 ， 并 遍历 
所 有 记号 。 

对 于 每 个 记号 ( token)， 我 们 通过 clang_getTokenKind() 获得 它 的 种 类 ， 并 通过 
clang_getTokenSpelling() 获得 与 之 对 应 的 代码 片段 。 然 后 ， 我 们 使 用 switch 结构 
打印 相应 的 文本 信息 ， 文 本 信息 取决 于 记号 种 类 以 及 与 该 记号 对 应 的 代码 片段 。 你 可 以 在 下 


面 的 示例 中 看 到 结果 。 
我 们 在 项 目 中 使 用 以 下 代码 作为 输入 : 


#include <stdio.h> 
int main() { 
printf ("hello, world!"); 


} 
运行 我 们 的 记号 分 析 器 后 ， 可 以 得 到 以 下 输出 : 


PUNCTUATION (#) IDENTIFIER (include) PUNCTUATION(<) IDENTIFIER(stdio) 
PUNCTUATION(.) IDENTIFIER(h) PUNCTURTION (>) KEYWORD (int) 
IDENTIFIER (main) PUNCTUATION(() PUNCTUATION()) PUNCTUATION ({) 
IDENTIFIER (printf) PUNCTUATION(() COMMENT ("hello, world!") 
PUNCTUATION()) PUNCTUATION(;) PUNCTURATION ( }) 


4.2.1.3” 预 处 理 

C/C++ 预 处 理 器 在 进行 任何 语义 分 析 之 前 使 用 ， 负 责 通过 处 理 以 # 开 头 的 预 处 理 指令 来 
扩展 宏 ， 或 包括 头 文件 ， 或 者 跳 过 部 分 代码 。 预 处 理 器 与 词法 分 析 器 紧密 相关 ， 并 连续 相互 
作用 。 因 为 它 在 前 端 早期 工作 ， 并 且 在 语义 分 析 尝 试 提 取代 码 含义 之 前 发 生 ， 所 以 可 以 使 用 
宏 来 做 一 些 有 趣 的 事 ， 比 如 用 宏 扩 展 来 改变 函数 声明 。 请 注意 ， 这 也 允许 我 们 对 编程 语言 语 
法 做 很 大 的 改进 。 如 果 你 愿意 ， 甚 至 可 以 像 图 4-2 这 样 编码 。 


器 | 4 | 国 Filecy》Noselection 
#include "SDL.h™ 





#define $ for(0=9 

#define CX M+=(T%3+2*!( !T*t-6)) 

#define x ,A=4*!T,0=t,W=h=T<37u(0?p:D(A+3),D(A) ,D(A+1) [i]+D(A+2)*g+) :K(t),U=V=K(a),o 
?U=h, WV: V， 

#define C 8# 一 L 

#define Z short 

#define y a(Z)Y[I++0] 

#define B ),a—||( 

#define _ ),e—||( 


#define V(I,D,E)(0=a(I)h[r] )&&! (A=(D) (V=/1[E+L]<<16)+%i)/0,A-(I)A)?1 [E+L]=V-0*(*E=A 
):H(9) 

sdefine i(B,M)B(o){return M;} 

#define R(0,M,_)(S=L?a(I Z)0:0, i Zi0 M(f=a(I Z)_):(0 M(f=a(T n)_))) 

#define T(_)R(r[u(16,L=4, 一 )] ,=,，_ 

#define utfar,T)16*i[al+(IT Z)(T im) 

#define at jw 本 )& 

adefinc L(_)M(W,_,U) 


sdefine M(S,F,T)R(r[S] ,F,r[T]) 
#define A(_)(i[L=4]+=2,R(_,=,r[u(19,4,-2+)])) 
| #define c(R,T)(i[u=19,L+T]=(N=a(R)h[r]*(RJ)+T)>>16,*i=N,G(F(N-(R)N) )) 
#define h(_)(1&(L?a(Z)_:_)>>C-1) 
#define I unsigned 
#define n char 
#define e(_)v(F(40[L(_##=40[E]+),E]EN==5|_ N<_(int)S)) 


IT n teL[I88186] ,*E,m,u,L,a,T,o,r[1<<21],X,*Y,b,Q=9,R=8;I Zri,M,p,q=3;l*localtime(), 
f,5,kb=9,h,W,U,c,g,d,V,A;N,0,P=983040, j [5]; SDL_Surfacexk=8;i(K, P+(L?2*o: 2*0+0/4& 
7))i(D, rla(I)EL259+4r0] +0])i(w, ifo] +=~(-2447 [ED )#~L)i(v, (z( (f=SN)&16), G(N-SES1 
&(46[E]^f>>C-1))))J(){V=-61442;$;0 一 ; jV+=49[E+0]<<D(25);}i(H, (46[u=76,3(),T(V),T 
(9[i]),T(M),M(P+18,=, 4*0+2),R(M,=, r[4*0] ), E]=8))s(0){$;0—; ja0 [E+0]=1551<<D(25)5 
Or}i(BPp, (*i+=262*0*2z(F( (+EL15)>9|42[E])), 4EE-15)) it(SP。 (wv(7) ,RE 一 11]5&&o7R++ OCS 
Q++ ,是 一 :9] )DX() {$,0*=27840;0—; Jol Un) Pixels le 11(1ec7 Oaer [0/2880+00+0%728/ 
8+(88+952[\]/128+4+0/728%4<<13)]);SDL_Flip(k); }main(BX,nE)mmnE; {91i=E=r+P]=P>>4 
;$;97)j [~—q]=*++nE?open(*nE,32898):0; read(2[a(I)*i=*j?lseek(*j,9,2)>>9:8,j],E+(M 
=256) ,Pp);$;Y=r+16#9 [i]+M,Y-ryQlRI1kbk46 [E] SSKB)—64 [T=1{0=32[L=(X=HY87)&1,0=X/25 
1,1]=8, t=(c=y)&7, 8=c/857,Y]>>6,g9=——T?Yy: (n)y, d=B8X=y, 1], !T*t-68&T-27T1-17d=g:0: (d=y 
),0550—, REER—x(O=*Y,0=u=D(51) ,e=D(8),m=D(14)_ 0O=*Y/257,M+={n)c*(L~^(D(m) [E] |D 
(22) [E] |D(23) [E]^D(24) [E]))_ L=*Y&8,R(K(X) [r] ,=,c)_ L=e+=3,0=0,8=X x a=m _ T(X[i 


图 4-2 
这 是 第 22 届 国 际 模糊 C 代码 大 赛 (IOCCC) 获奖 者 之 一 Adrian Cable 的 代码 ， 这 里 我 
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们 依据 Creative Commons Attribution-ShareAlike 3.0 许可 证 复制 参赛 者 的 源 代码 。 该 段 代 码 
实现 了 一 个 8086 模拟 器 。 如 果 想 了 解 如 何 解析 此 代码 ， 请 阅读 10.3.3 节 。 要 扩展 宏 ， 还 可 
以 使 用 -了 选项 来 运行 编译 器 驱动 程序 ， 使 用 该 选项 将 只 运行 预 处 理 器 然后 中 断 编 译 ， 不 执 
行进 一 步 的 分 析 。 

预 处 理 器 允许 将 源 代 码 转 换 为 无 法 理解 的 文本 ， 这 其 实 也 是 在 警告 我 们 要 谨慎 地 使 用 
宏 。 除 此 之 外 ， 词 法 分 析 器 会 对 记号 流 做 预 处 理 ， 以 处 理 诸如 宏和 编译 指示 (pragma) 之 类 
的 预 处 理 指 令 。 预 处 理 器 使 用 一 个 符号 表 来 存放 定义 的 宏 ， 一 旦 宏 被 实例 化 ， 保 存在 符号 表 
中 的 记号 将 替换 当前 记号 。 

如 果 安 装 了 Clang 外 部 工具 ( 见 第 2 章 )， 则 可 以 在 命令 提示 符 下 运行 pp-trace。 这 
个 工具 可 以 显示 预 处 理 器 的 活动 。 

以 下 面 bp .c 为 例 : 


#define EXIT SUCCESS 0 
int main() { 
return EXIT SUCCESS; 


} 
如 果 使 用 -E 选项 运行 编译 器 驱动 程序 ， 将 看 到 以 下 输出 : 
$ clang -E PP.c -oO PP2.c && cat pp2.c 
int main() { 
return 0; 


} 
如 果 运 行 pp-trace 工具 ， 将 看 到 以 下 输出 : 


$ pp-trace pp.c 


- Callback: MacroDefined 
MacroNameTok: EXIT SUCCESS 
MacroDirective: MD Define 
- Callback: MacroExpands 
MacroNameTok: EXIT SUCCESS 
MacroDirective: MD Define 
Range: ["/examples/pp.c:3:10", "/examples/pp.c:3:10"] 
Args: (null) 
- Callback: EndOofMainFile 


在 开始 预 处 理 实际 文件 之 前 ， 我 们 省 略 了 pp-trace 转 储 的 内 置 宏 的 长 列表 。 实 际 上 ， 
如 果 你 想 知道 编译 器 驱动 程序 在 构建 源 程序 时 默认 定义 了 哪些 宏 , 该 列表 是 非常 有 用 的 。 
pp-trace 工具 是 通过 重 写 预 处 理 器 回调 函数 来 实现 的 ， 这 意味 着 ， 你 可 以 在 你 的 工具 中 
实现 每 次 预 处 理 程序 运行 时 都 会 调用 的 功能 。 

在 我 们 的 例子 中 ， 它 执行 了 两 次 操作 : 读 取 EXIT_SUCCESS 宏 定义 ， 然 后 在 第 3 行 中 
展开 它 。 如 果实 现 了 MacroDefined 回调 ，pp-trace 工具 还 会 打印 出 你 的 工具 将 接收 的 





参数 。 该 工具 很 小 ， 如 果 你 希望 实现 预 处 理 器 回调 ， 第 一 步 最 好 是 阅读 它 的 源 代码 。 


4.2.2 语法 分 析 


在 词法 分 析 把 源 代 码 解析 成 记号 之 后 ， 编 译 器 会 进行 语法 分 析 ， 并 将 记号 组 合 在 一 起 形 
成 表达 式 、 语 句 和 函数 体 等 。 语 法 分 析 负 责 根据 一 组 记号 的 代码 布局 决定 把 它们 组 合 在 一 起 
是 否 合理 。 但 是 这 个 过 程 不 涉及 代码 的 含义 分 析 ， 就 如 同 英文 中 的 语法 分 析 只 关心 句子 的 结 
构 是 否 正确 ， 并 不 关心 句子 的 含义 。 这 种 分 析 过 程 也 称 为 解析 ， 它 的 输入 为 一 个 记号 流 ， 输 
出 为 抽象 语法 树 (AST)。 

4.2.2.1 了 解 Clang AST 节点 

AST 节点 表示 声明 、 语 句 或 类 型 。 因 此 ， 有 三 个 核心 类 来 表示 AST 节点 : Decl、stmt 
和 Type。 在 Clang 中 ， 每 个 C 或 C++ 语言 结构 由 C++ 类 表示 ， 该 类 必须 从 这 些 核心 类 继承 
而 来 。 图 4-3 展示 了 该 类 层次 结构 的 一 部 分 。 在 这 个 例子 中 ，IfStmt 类 (表示 一 个 完整 的 
if 语句 体 ) 直接 继承 Stmt 类 。 男 一 方面 ，FunctionDecl 和 VarDecl 类 (用 于 保存 函数 
和 变量 的 声明 或 定义 ) 从 多 个 类 继承 ， 并 且 只 能 间接 地 到 达 Decl 类 。 












NamedDecl 








ValueDecl LabelDecl FunctionType 





PointerType 


DeclaratorDecl 





FunctionDecl 


图 4-3 





读者 可 以 通过 每 个 类 的 Doxygen 页 面 查 看 完整 的 图 表 。 例 如 对 于 Stmt 类 ， 其 Doxygen 
页 面 位 于 http://clang.llvm.org/doxygen/classclang 1 _1Stmt .html， 读 者 
可 以 点 击 子 类 来 找到 它们 的 直接 派生 类 。 

抽象 语法 树 中 最 顶层 的 节点 是 TranslationUnitDecl 类 。 它 是 所 有 其 他 AST 节点 
的 根 ， 代 表 整 个 翻译 单元 。 以 4.2.1 节 的 min.c 源 代 码 为 例 ， 这 里 我 们 使 用 -ast-dump 开 
关 来 打印 其 AST 节点 : 

$ clang -feyntax-only -xXclang -ast-dump min.c 


TranslationUnitDec]l .… 


- edefDecl ... ntl Ct nt 
| Typedef 十 _ 28 二 
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|-TypedefDec] .. uint128 t 'unsigned _int128' 
| -TypedefDec1l .. builtin va list ' va list tag [1]' 
~-FunctionDecl . <min.c:1:1, line:5:1> min 'int (int, int)' 
|-ParmVarDecl . <line:1:7, col:11> a 'int!' 
| -ParmVarDec1l . <col:14, col:18> b 'int' 
~-Compoundstmt ... <col:21, line:5:1> 


注意 最 顶层 的 翻译 单元 声明 TranslationUnitDecl 以 及 由 FunctionDecl 表示 的 
min 函数 声明 。CompoundStmt 声明 包含 其 他 语句 和 表达 式 ， 使 用 以 下 命令 可 以 查看 如 图 
4-4 所 示 的 min.c 的 函数 体 AST 视图 : 


$ clang -fsyntax-only -Xclang -ast-view min.c 


CompoundStmt 


BinaryOperator 


ImplicitCastExpr ImplicitCastExpr ImplicitCastExpr DeclRefExpr 
DeclRefExpr DeclRefExpr DeclRefExpr 


图 4-4 





其 中 ，CompoundStmt 类 对 应 的 AST 节点 包含 if 和 return 语句 ， 分 别 由 Ifstmt 类 和 
ReturnStmt 类 表示 。 每 次 使 用 a 和 b 都 会 生成 一 个 C 语言 标准 要 求 的 int 类 型 的 Implicit 
CastExpr 表达 式 。 

ASTContext 类 包含 翻译 单元 的 完整 AST。 可 以 通过 ASTContext::getTranslat 
ionUnitDec1l() 接口 获得 顶层 的 TranslationUnitDecl 实例 ， 通 过 它 可 以 访问 AST 
中 的 任意 节点 。 

4.2.2.2 ”通过 调试 器 了 解 解 析 器 操作 

LLVM 的 解析 器 将 处 理 和 消费 在 词法 分 析 阶 段 生 成 的 记号 集 ， 在 此 过 程 中 ,一 旦 一 
组 必需 的 记号 聚合 在 一 起 ， 就 会 生成 一 个 相应 的 AST 节点 。 例 如 ,每 当 解析 器 找到 记号 
tok: :kw_if 时 ， 就 会 调用 ParseIfStatement 函数 ， 并 消费 if 体 中 的 所 有 记号 ， 同 时 
为 它们 生成 所 有 必需 的 AST 子 节点 和 IfStmt 根 节点 。 请 参阅 Lib/Parse/ParseStmt .。 
cpp (第 212 行 ) 文件 中 的 代码 段 ， 如 下 所 示 : 


case 七 OK 
return 
case tok 
return 


::kw_ if: // C99 6.8.4.1: if-statement 
ParseIfStatement (TrailingElseLoc); 

// C99 6.8.4.2: switch-statement 
ParseSwitchstatement (TrailingElseLoc); 


: :kw _ switch: 


通过 从 调试 器 gdb 转 储 该 函数 调用 的 backtrace， 可 以 更 好 地 了 解 Clang 如 何在 


min.c 中 到 达 ParseIfStatement 方法 : 


$ gdb clang 
$ b ParseStmt.cpp:213 


$ r -ccl -fsyntax-only min.c 


213 


return ParseIfStatement (TrailingElseLoc); 


(gdb) backtrace 


#0 clang::Parser::ParseStatementOrDeclarationAfterAttributes 
#1 clang::Parser::ParseStatementOrDeclaration 

#2 clang::Parser::ParseCompoundSstatementBody 

#3 clang::Parser::ParseFunctionStatementBody 

#4 clang::Parser::ParseFunctionDefinition 

#5 clang::Parser::ParseDeclGroup 

#6 clang::Parser::ParseDeclOrFunctionDefInternal 

#7 clang::Parser::ParseDeclarationOrFunctionDefinition 
#8 clang::Parser::ParseExternalDeclaration 

#9 clang::Parser::ParseTopLevelDecl 

#10 clang::ParseAsT 

#11 clang: :ASTFrontendAction: :ExecuteAction 

#12 clang::FrontendAction::Execute 

#13 clang::CompilerIinstance: :ExecuteAction 

#14 clang::ExecuteCompilerInvocation 

#15 ccl1 main 

#16 main 


解析 表 首 先 执行 ParseAST( ) 浮 数 ， 通 过 Parser::ParseTopLevelDecl() 读 取 
顶层 声明 ， 再 开始 该 翻译 单元 的 解析 。 然 后 ， 解 析 器 处 理 所 有 后 续 的 AST 节点 并 消费 相关 
联 的 记号 ， 这 个 过 程 中 也 负责 将 每 个 新 的 AST 节点 链接 到 其 父 AST 节点 。 当 所 有 记号 消 
费 完 后 ，LLVM 的 执行 流程 返回 到 ParseAST() 中 。 之 后 ， 解 析 器 的 使 用 者 可 以 从 顶层 的 
TranslationUnitDecl 访问 所 有 AST 节点 。 

4.2.2.3 解析 器 错误 实例 

以 parse.c 中 的 以 下 for 语句 为 例 : 


void func() { 
int n; 


Eox 


} 


(n= 


0n < 10; n++); 


代码 中 的 错误 在 于 n=0 之 后 缺少 一 个 分 号 。 下 面 是 编译 时 Clang 输出 的 诊断 信息 : 





$ clang -c parse.c 
Parse.c:3:14: error: expected ';' in 'for' statement specifier 


for (n= 0n < 10; n++); 


入 


1 error generated. 


现在 来 运行 我 们 的 诊断 项 目 : 


$ ./myproject parse.c 


Severity: 3 File: parse.c Line: 3 Col: 14 Category: "Parse Issue" 
Message: expected ';' in 'for' statement specifier 


由 于 本 示例 中 的 所 有 记号 都 是 正确 的 ， 所 以 词法 分 析 可 以 成 功 完成 ， 不 会 产生 诊断 信 
息 。 然 而 ， 在 将 记号 分 组 到 一 起 来 查看 它们 在 构建 AST 时 是 否 有 意义 时 ， 解 析 器 注意 到 
for 结构 缺少 分 号 。 在 这 种 情况 下 ， 我 们 的 诊断 类 别 是 “Parse Issue”( 解 析 问 题 )。 

4.2.2.4 编写 遍历 Clang AST 的 代码 

libclang 接口 允许 通过 一 个 指向 当前 AST 的 某 个 节点 的 游标 对 象 来 遍历 Clang AST。 
使 用 clang_getTranslationUnitCursor() 函数 可 以 获得 最 顶层 的 游标 。 

在 本 示例 中 ， 我 们 将 编写 一 个 工具 来 输出 C 或 C++ 源 文 件 中 包含 的 所 有 C 函数 或 C++ 
方法 的 名 称 : 


extern "C" { 

#include "clang-c/Index.h" 

} 

#include "llvm/Support/CommandLine.h" 
#include <iostream> 


using namespace llvm; 
static cl::opt<std::string> 
FileName (cl::Positional, cl::desc("Input file"), cl::Required); 


enum CXChildVisitResult visitNode (CXCursor cursor, CXCursor parent, 
CxClientData client data) { 
if (clang getCursorKind(cursor) == CXCursor CXXMethod | | 
clang getCursorKind(cursor) == CXCursor FunctionDecl) { 
CXString name = clang getCursorSpelling (cursor); 
CXSourceLocation loc = clang getCursorLocation(cursor); 
CXString fName; 
unsigned line = 0, col = 0); 
clang getPresumedLocation(loc, &fName, &line, &col); 
std::cout << clang getCstring(fname) << ":" 
<< line << ":"<< Col << " declares " 
<< clang getCSstring (name) << std::endl; 
return CXChildVisit Continue; 


} 


return CxXChildVisit Recurse; 


} 


int main(int argc, char** argv) 


{ 


cl::ParseCommandLineOptions (argc, argv, "AST Traversal Example"); 


CXindex index = clang createIndex(0, 0); 

const char *args[] = { 
n-I/usr/include", 

WW I" 

}; 

CxTranslationUnit translationUnit = clang parseTranslationUnit 
(index, FileName.c str(), args, 2, NULL, 0, 
CxTranslationUnit None); 

CXCursor cur = clang getTranslationUnitCursor(translationUnit),; 

clang visitChildren(cur, visitNode, NULL); 

clang disposeTranslationUnit (translationUnit); 

clang disposeIndex (index); 

return 0; 

} 

这 个 例子 中 最 重要 的 函数 是 clang_visitchildren(), 它 以 递归 的 方式 访问 其 参数 
游标 的 所 有 子 节 点 ， 并 在 每 次 访问 时 调用 一 个 回调 函数 。 我 们 通过 定义 这 个 回调 函数 来 开始 
我 们 的 代码 ， 并 把 它 命名 为 visitNode()。 此 函数 必须 返回 一 个 CXChildVisitResult 
枚 举 的 成 员 值 ， 该 值 只 有 三 种 可 能 : 

e 当 我 们 想 要 clang visitchildren() 通过 访问 当前 所 在 节点 的 子 节点 来 继续 其 

AST 裔 历时， 返回 CxChildVisit Recurse。 

e 当 我 们 希望 它 跳 过 当前 所 在 节点 的 子 节点 继续 访问 时 ， 返 回 CXchildVisit_ 

Continue。 

e 当 我 们 不 希望 clang visitchildqren() 再 访问 更 多 的 节点 时 ， 返 回 

CXChildVisit_Break。 

我 们 定义 的 回调 函数 接收 三 个 参数 : 代表 当前 正在 访问 的 AST 节点 的 游标 ; 代表 该 节 
点 的 父 节 点 的 游标 ; 一 个 CXClientData 对 象 ， 它 是 对 void 指针 的 typedef 定义 。 该 指 
针 人 允许 传递 我 们 和 希望 跨 回 调调 用 维护 其 状态 的 任何 数据 结构 ， 这 对 用 户 构 造 自己 的 分 析 非 常 
有 用 。 


< 虽然 此 代码 结构 可 用 于 代码 分 析 ， 但 如 果 需 要 采用 诸如 控制 流 图 ( CFG) 这 样 的 更 
R 为 复杂 的 结构 ， 则 不 要 使 用 游标 或 libclang， 而 应 使 用 Clang 插件 实现 该 代码 分 
析 ， 该 插件 可 以 直接 使 用 Clang C++API 从 AST 创 建 CFG (参见 http://clang. 
llvm.org/docs/ClangPlugins.html 和 CFG::buildCcFG 方法 )。 通 常 ， 从 
AST 进行 代码 分 析 比 使 用 CFG 进行 分 析 更 为 困难 。 还 可 以 阅读 第 9 章 ， 它 解释 了 

如 何 构建 强大 的 Clang 静态 分 析 。 


我 们 的 示例 忽略 了 client_data 和 parent 参数 ， 只 是 通过 clang_getCursorKind() 
函数 简单 地 询问 当前 的 游标 是 指向 C 函数 声明 ( CXCursor FunctionDecl), 还 是 指 
向 C++ 方法 〈(CXCursor_CXXMethod)。 如 果 确 定 正在 访问 正确 的 游标 ， 则 使 用 两 个 函数 
从 游标 提取 信息 : 用 clang_getcursorspelling() 函数 获取 与 此 AST 节点 对 应 的 代 
码 片 段 , 用 clang_getCcursorLocation() 函数 获取 与 之 关联 的 CXSourceLocation 


雯 殉 好 


对 象 。 之 后 ， 使 用 实现 诊断 项 目 时 所 使 用 的 相似 方式 打印 信息 ， 并 且 在 函数 最 后 返回 
CXChildVisit_Continue。 这 样 选 择 的 原因 是 我 们 确定 没有 藤 套 的 函数 声明 ， 因 此 通过 
访问 这 个 游标 的 子 游标 来 继续 遍历 是 没有 意义 的 。 

如 果 该 游标 不 是 我 们 期 望 的 ， 只 需 简 单 地 通过 返回 CXChilqdvVisit_Recurse 来 继续 
执行 AST 递归 遍历 。 

在 实现 visitNode 回调 函数 之 后 ， 剩 下 的 代码 就 变 得 简单 了 。 我 们 使 用 初始 样 
板 代码 来 解析 命令 行 参数 ， 并 解析 输入 文件 。 之 后 ， 用 最 顶层 游标 和 回调 函数 调用 
visitchildren()。 最 后 一 个 参数 是 不 会 用 到 的 客户 端 数据 ， 设 置 为 NULL。 

我 们 将 在 以 下 输入 文件 中 运行 此 项 目 : 


#include <stdio.h> 
int main() { 
printf ("hello, world!"); 


} 
输出 结果 为 : 


$ ./myproject hello.c 


hello.c:2:5 declares main 


该 项 目 还 会 打印 声明 函数 的 stdio .h 头 文件 中 的 每 一 行 信息 ， 该 信息 数量 巨大 ， 但 为 
了 简洁 起 见 ， 我 们 在 这 里 省 略 了 。 

4.2.2.5 ”使 用 预 编译 头 文件 序列 化 AST 

可 以 将 Clang AST 序列 化 并 保存 在 以 PCH 为 扩展 名 的 文件 中 。 此 功能 可 以 避免 重复 处 
理 不 同 项 目 源 文 件 中 的 相同 头 文件 ， 从 而 加 快 编 译 速 度 。 当 选择 使 用 PCH 文件 时 ， 所 有 头 
文件 都 预 编译 为 单个 PCH 文件 ， 并 且 在 编译 翻译 单元 时 ， 预 编译 头 文件 中 的 信息 会 被 惰性 
获取 ( 即 只 有 在 用 到 时 才 获 取 )。 

例如 ， 为 了 生成 C 语言 的 PCH 文件 ， 应 该 使 用 与 GCC 中 用 于 生成 预 编译 头 文件 相同 
的 语法 ， 即 使 用 -x c-header 标志 ， 如 下 所 示 : 


$ clang -x c-header myheader.h -o myheader.h.pch 
要 使 用 新 的 PCH 文件 ， 应 该 这 样 使 用 -include 标志 : 


$ clang -include myheader.h myproject.c -o myproject 


4.2.3 语义 分 析 


语义 分 析 借 助 于 符号 表 来 确保 代码 是 否 违反 编程 语言 的 类 型 系统 。 该 表 主 要 存储 了 标识 
符 (符号 ) 与 其 各 自 类 型 之 间 的 映射 。 一 种 直观 的 类 型 检查 方法 是 在 解析 之 后 执行 它 ， 具 体 
做 法 是 在 从 符号 表 中 收集 有 关 类 型 的 信息 的 同时 遍历 AST。 

但 是 Clang 并 不 采取 这 种 方法 。 相 反 ， 它 在 生成 AST 节 点 的 同时 执行 类 型 检查 。 让 
我 们 回 到 min.c 解 析 示 例 。 在 那 种 情况 下 ，ParseIfStatement 函数 调用 语义 动作 
RctonIfStmt 来 执行 if 语句 的 语义 检查 ， 从 而 相应 地 发 送 诊断 信息 。 


在 Lib/Parse/ParseStmt .cpp 的 第 1082 行 中 ， 可 以 观察 到 控制 权 的 转移 以 允许 语 
义 分 析 发 生 : 


return RActions .ActOnIfStmt (IfLoc, FullCondExp, ...); 


为 了 辅助 执行 语义 分 析 ，Declcontext 基 类 包含 每 个 作用 域 的 第 一 个 到 最 后 一 个 
Dec1l 节点 的 引用 。 这 就 简化 了 语义 分 析 ， 因 为 若 要 执行 名 称 引 用 的 符号 查找 ， 并 检查 符号 
类 型 和 符号 是 否 实际 存在 ,语义 分 析 引 擎 可 以 通过 查看 从 DeclContext 派生 的 AST 节点 
来 查找 符号 声明 。 像 这 样 的 AST 节点 示例 有 TranslationUnitDecl、FunctionDecl 
和 ZLabelDec1l。 

针对 min.c 示例 ， 可 以 使 用 Clang 输出 声明 的 上 下 文 ， 如 下 所 示 : 

$ clang -fsyntax-only -Xclang -print-decl-contexts min.c 

[translation unit] 0x7faf320288f0 
<typedef> intl28 t 
<typedef> uint128 上 
<typedef> builtin va list 
[function] f(a, b) 

<Parameter> a 


<parameter> b 


请 注意 ， 只 有 在 TranslationUnitDecl 和 FunctionDecl 内 部 的 声明 才 会 显示 在 
结果 上 ， 因 为 只 有 它们 是 从 Declcontext 派生 的 节点 。 

语义 错误 实例 

以 下 sema.c 文件 包含 使 用 标识 符 a 的 两 个 定义 : 


int al[4]; 
int al[ls]; 


之 所 以 上 面 的 代码 有 和 错误， 是 因为 两 个 不 同 的 变量 使 用 了 相同 的 名 称 。 语 义 分 析 必 须 检 
查 到 这 样 的 错误 ， 而 Clang 会 以 如 下 方式 报告 该 问题 : 


$ clang -c sema.c 
sema.c:3:5:; error: redefinition of 'a' with a different type 


int al[l5]; 


人 


sema.c:2:5: note: previous definition is here 
int a[l4]; 


人 


1 error generated. 


如 果 运 行 诊断 项 目 ， 会 得 到 以 下 输出 : 
$ ./myproject sema.c 


Severity: 3 File: sema.c Line: 2 Col: 5 Category: "Semantic Issue" 
Message: redefinition of 'a' with a different type: 'int [5]' vs 'int 
LA 
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4.2.4 ”生成 LLVM IR 代码 


在 进行 组 合 的 解析 和 语义 分 析 之 后 ，ParseAST 卫 数 调用 HandleTranslationUnit 
方法 来 触发 有 兴趣 消费 最 终 AST 的 任何 客户 端 。 如 果 编 译 器 驱动 程序 使 用 CodeGenAction 
前 端 动作 ， 则 该 客户 端 将 是 BackendCconsumer， 它 将 遍历 AST， 同 时 生成 LLVM IR 代 
码 ， 该 代码 能 实现 与 树 中 所 表示 的 代码 完全 相同 的 行为 。 翻 译 为 LLVM IR 的 过 程 是 从 顶层 
声明 TranslationUnitDecl 开始 的 。 

如 果 继 续 使 用 之 前 的 min.c 示例 ， 编 译 器 将 通过 函数 EmitIfStmt 把 lib/CodeGen/ 
CGStmt .cpP (第 130 行 ) 中 的 if 语句 转换 为 LLVM IR。 通 过 调试 器 backtrace， 可 以 看 
到 从 ParseAST 函数 到 EmitIfstmt 的 调用 路 径 : 


$ gdb clang 
(gdb) b CGStmt.cpp:130 
(gdb) r -ccl -emit-obj min.c 


130 case Stmt::IfStmtClass: EmitIfStmt (cast<IfStmt>(*S)); 
break; 


(gdb) backtrace 

#0 clang::CodeGen::CodeGenFunction::Emitstmt 

#1 clang::CodeGen::CodeGenFunction: :EmitCompoundStmtWithoutScope 
#2 clang::CodeGen::CodeGenFunction::;EmitFunctionBody 

#3 clang::CodeGen: :CodeGenFunction: :Generatecode 

#4 clang::CodeGen::CodeGenModule::EmitGlobalFunctionDefinition 
#5 clang::CodeGen::CodeGenModule::EmitGlobalDefinition 

#6 clang::CodeGen::CodeGenModule: :EmitGlobal 

#7 clang::CodeGen::CodeGenModule::EmitTopLevelDecl 

#8 (anonymous namespace)::CodeGeneratorImpl::HandleTopLevelDecl 
#9 clang::BackendConsumer: :HandleTopLevelDecl 


#10 clang::ParseAsT 


随 着 代码 被 翻译 成 LLVM IR， 我 们 完成 了 前 端 步 又。 如 果 继 续 执行 常规 流程 ， 将 使 用 
LLVM IR 来 优化 LLVM IR 代码 ， 并 且 后 端 开始 生成 目标 代码 。 如 果 你 想 为 自己 的 语言 实现 
一 个 前 端 ， 可 以 阅读 Kaleidoscope 前 端 教程 : http://1llvm.org/docs/tutorial。 在 
下 一 节 中 ， 我 们 将 介绍 如 何 编写 一 个 简化 的 Clang 驱动 程序 ， 该 驱动 程序 将 前 面 讨 论 过 前 端 
阶段 合并 在 一 起 。 


4.3 完整 的 例子 


我 们 将 借助 本 节 的 例子 向 你 介绍 Clang C++ 接口 ， 而 不 再 依赖 libclang 库 的 C 接口 。 
通过 使 用 内 部 Clang C++ 类， 我们 将 创建 一 个 程序 ， 将 词法 分 析 器 、 解 析 器 和 语义 分 析 应 用 
于 输入 源 文件 ， 因 此 ， 我 们 将 有 机 会 做 一 个 简单 的 FrontendRction 对 象 所 做 的 工作 。 读 
者 可 以 继续 使 用 本 章 开 头 介绍 的 Makefile。 但 是 ， 我 们 建议 关闭 编译 器 标志 -Wall-Wextra， 
因为 它 将 为 Clang 头 文件 生成 与 未 使 用 的 参数 相关 的 大 量 警 告 。 


此 示例 的 源 代 码 如 下 所 示 : 


#include "11vm/RADT/IntrusiVveRefCntPtr .hn 
#include "llvm/Support/CommandLine.h" 
#include "llvm/Support/Host.h" 

#include "clang/RAST/RASTContext .hy 

#include "clang/AST/ASTConsumer.h" 

#include "clang/Basic/Diagnostic.h" 

#include "clang/Basic/DiagnosticOptions.h" 
#include "clang/Basic/FileManager.h" 
#include "clang/Basic/SourceManager.h" 
#include "clang/Basic/LangOptions.h" 
#include "clang/Basic/TargetInfo.h" 

#include "clang/Basic/TargetOptions.h" 
#include "clang/Frontend/ASTConsumers.h" 
#include "clang/Frontend/CompilerInstance.h" 
#include "clang/Frontend/TextDiagnosticPprinter.h" 
#include "clang/Lex/Preprocessor.h" 

#include "clang/Parse/Parser.h" 

#include "clang/Parse/ParseAST.h"' 

#include <iostream> 


using namespace llvm; 
using namespace clang; 


static cl::opt<std: :string> 
FileName (cl::Positional, cl::desc("Input file'"), cl::Required); 


int main(int argc, char **argv) 
{ 
cl::ParseCommandLineOptions (argc, argv, "My simple front end\n"); 
CompilerIinstance CI; 
Diagnosticoptions diagnosticOptions; 
CI.createDiagnostics(); 


IntrusiveRefCntPtr<TargetOptions> PTO (new TargetOptions()); 
PTO->Triple = sys::getDefaultTargetTriple(); 


TargetInfo *PTI = TargetInfo: :CreateTargetInfo(CI. 
getDiagnostics(), PTO.getPtr()); 

CI.setTarget (PTI) ; 

CI.createFileManager () ; 

CI.createSourceManager (CI .getFileManager () ) ; 

CI. createPreprocessor () ; 

CI.getPreprocessorOpts() .UsePredefines = false; 

ASTConsumer *astConsumer = CreateASTPrinter (NULL, ""); 

CI.setASTConsumer (astConsumer); 


CI.createASTContext () ; 
CI.createSema (TU_Complete，NULL) ; 
const FileEntry *pFile = CI.getFileManager() .getFile (FileName); 
if (!pFile) { 
std::cerr << "File not found: " << FileName << std::endl; 
return 1; 


} 


CI.getSourceManager () .createMainFileID (pFile); 
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CI.getDiagnosticsCclient().BeginSourceFile(CI.getLangopts()，0) ; 
ParseAST (CI.getSema () ) ; 

// Print AST statistics 

CI.getASTContext () .PrintStats () ; 
CI.getRASTContext () .Idents. PrintStats():; 


return 0; 

} 

上 述 代码 对 从 命令 行 指定 的 输入 源 文件 运行 词法 分 析 器 、 解 析 器 和 语义 分 析 。 最 后 ， 它 
会 打印 经 过 解析 的 源 代 码 和 AST 统计 信息 。 此 代码 的 执行 步骤 如 下 : 

1. CompilerInstance 类 负责 管理 处 理 编译 的 整个 基础 架构 (请 参阅 http:// 
clang.llvm.org/doxygen/classclang 1 lCompilerIinstance.html), 第 一 步 
是 实例 化 该 类 并 将 其 保存 到 cI。 

2. clang -ccl 工 具 通 常 将 实例 化 一 个 特定 的 FrontendRction 对 象 ， 该 对 象 将 执 
行 上 述 代码 示例 中 包含 的 所 有 步 又。 由 于 我 们 只 是 介绍 这 些 步骤 ， 因 此 未 使 用 Frontend 
Action 类 ， 而 是 自己 配置 CompilerInstance。 我 们 使 用 compilerInstance 方法 来 
创建 诊断 引擎 ， 并 通过 从 系统 获取 目标 三 元 组 来 设置 当前 目标 。 

3. 实例 化 三 项 新 资源 : 文件 管理 器 、 源 代码 管理 器 和 预 处 理 器 。 第 一 个 是 读 取 源 
文件 所 必需 的 ， 而 第 二 个 负责 管理 在 词法 分 析 器 和 解析 器 中 使 用 的 SourceLocation 
实例 。 

4. 创建 一 个 ASTConsumer 引用 并 将 其 推送 给 cT。 这 将 允许 前 端 客 户 端 自 定义 最 终 的 
AST (在 解析 和 语义 分 析 之 后 产生 ) 的 消费 方式 。 例 如 ， 如 果 我 们 希望 此 驱动 程序 生成 LLVM 
IR 代码 ， 则 必须 提供 一 个 特定 的 代码 生成 ASTConsumer 实例 ( 称 为 BackendConsumer)， 
这 正 是 例子 中 CodeGenAction 设 置 其 compilerInstance 的 ASTConsumer 时 所 做 的 
事情 。 这 个 例子 包含 头 文件 ASTConsumers .h， 该 文件 提供 各 种 各 样 可 供 我 们 实验 的 消费 
者 ,我 们 通过 createASTPrinter() 调用 创建 一 个 消费 者 ， 它 仅仅 将 AST 打印 输出 。 如 
果 你 有 兴趣 ， 请 花 一 些 时 间 实 现 自己 的 ASTConsumer 子 类 ， 以 执行 任何 感 兴趣 的 前 端 分 析 
(可 参考 1ib/Frontend/ASTConsumers .cpp 中 的 实现 示例 )。 

5. 创建 一 个 由 解析 器 使 用 的 新 ASTContext 对 象 和 由 语义 分 析 使 用 的 Sema 对 象 ， 并 
将 它们 推送 给 我 们 的 cI 对 象 。 我 们 还 初始 化 诊断 消费 者 (在 这 种 情况 下 ， 我 们 的 标准 消费 
者 也 只 将 诊断 信息 打印 到 屏幕 上 )。 

6. 调用 ParseAST 执行 词法 和 语法 分 析 ， 这 将 通过 调用 HandleTranslationUnit 
函数 来 调用 我 们 的 ASTConsumer。 如 果 在 任何 前 端 阶段 出 现 严 重 错 误 ，Clang 都 会 打印 诊 
断 信 息 并 中 断 处 理 流程 。 

7. 将 AST 统计 数据 打印 到 标准 输出 。 

在 下 面 的 文件 中 测试 这 个 简单 的 前 端 工 具 : 


int main() { 
char *msg = "Hello, world!\n"; 
write(l1, msg, 14); 
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return 0; 


} 
生成 的 结果 如 下 : 


$ ./myproject test.c 

int main() { 
char *msg = "Hello, world!l\n"; 
write(l1, msg, 14); 
return 0; 


} 


***w AST Context Stats: 
39 types total. 

31 Builtin types 

3 Complex types 

3 Pointer types 

1 ConstantArray types 

1 FunctionNoProto types 
Total bytes = 544 
0/0 implicit default constructors created 
0/0 implicit copy constructors created 
0/0 implicit copy assignment operators created 
0/0 implicit destructors created 


Number of memory regions: 1 

Bytes used: 1594 

Bytes allocated: 4096 

Bytes wastes: 2502 (includes alignment, etc) 


4.4 ”总 结 


在 本 章 中 ， 我们 描述 了 Clang 前 端 。 首 先 解释 了 Clang 前 端 库 、 编 译 器 驱动 程序 和 
clang -ccl 工具 中 的 实际 编译 器 之 间 的 区 别 。 还 谈 到 诊断 ， 并 介绍 了 一 个 小 的 1ibclang 
程序 来 输出 它们 。 

接 下 来 ,通过 展示 Clang 如 何 实现 各 个 阶段 ， 介 绍 了 前 端的 所 有 步骤 : 词法 分 析 器 、 解 
析 器 、 语 义 分 析 和 代码 生成 。 在 本 章 最 后 ， 介 绍 了 如 何 编写 一 个 激活 所 有 前 端 阶段 的 简单 
编译 器 驱动 程序 。 如 果 读 者 有 兴趣 阅读 更 多 关于 AST 的 资料 ， 可 以 查看 http://clang. 
LI1Lvm.org/docs/IntrodquctionToTheCclangRAST .html。 

关于 Clang 设计 的 详细 信息 ， 建 议 先 阅读 http://clang.llvm.org/docs/Internals 
Manual .html， 然 后 再 深入 了 解 实际 的 源 代码 。 

在 下 一 章 中 ,我 们 将 介绍 编译 流程 的 下 一 步 : LLVM 中 间 表 示 。 
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LLVM 中 间 表 示 ( IR) 是 连接 前 端 和 后 端的 桥梁 ， 它 使 得 LLVM 可 以 解析 多 种 源 语言 ， 
并 为 多 个 目标 生成 代码 。 前 端 产 生 IR， 而 后 端 消费 它 。IR 也 是 在 LLVM 中 执行 大 多 数 与 目 
标 无 关 的 优化 的 地 方 。 本 章 将 介绍 以 下 主题 : 

e LLVM IR 的 特点 

e LLVM IR 语言 语法 

e 如 何 编写 一 个 生成 LLVM IR 的 工具 

e LLVM IR 流程 结构 

e 如 何 写 自己 的 IR 流程 


5.1 概述 

选择 编译 器 IR 的 决策 非常 重要 ， 它 决定 了 优化 过 程 将 拥有 多 少 信息 来 使 代码 运行 得 更 
快 。 一 方面 ， 非 常 高 层级 的 IR 允许 优化 器 轻松 地 提取 原始 源 代码 的 相关 信息 。 另 一 方面 ， 低 
层 的 IR 更 加 贴近 目标 机 器 ， 这 样 编译 器 更 容易 为 特定 的 硬件 生成 相应 的 代码 ， 并 有 更 可 能 利 
用 目标 机 器 的 特性 。 但 是 IR 的 选择 也 不 能 过 于 底层 。 首 先 ， 当 编译 器 将 程序 转换 为 更 接近 机 
器 指令 的 表示 时 ， 将 程序 片段 映射 到 源 代码 会 变 得 越 来 越 困 难 。 其 次 ， 如 果 编 译 器 的 IR 设计 
采用 与 特定 目标 机 器 非常 相似 的 表示 ， 将 不 利于 为 其 他 具有 不 同 结构 的 机 器 生成 代码 。 

这 种 设计 权衡 导致 了 对 编译 器 的 不 同 选择 。 例 如 ， 某 些 编译 器 仅 支持 一 种 特定 的 目标 机 
器 架构 ， 不 能 支持 为 多 个 目标 生成 代码 。 这 种 编译 器 的 典型 代表 是 Intel C++ 编译 器 icc， 
它 在 整个 编译 过 程 中 使 用 专门 为 目标 架构 定制 的 IR， 从 而 可 以 提升 编译 器 在 单一 架构 上 的 
编译 效率 。 但 如 果 编 译 器 的 目的 是 支持 多 个 目标 ， 则 为 每 个 架构 编写 一 个 生成 代码 的 编译 器 
是 低 效 率 的 解决 方案 ， 最 理想 的 方案 是 设计 一 个 在 各 种 目标 上 都 能 良好 执行 的 编译 器 ， 比 如 
GCC 和 LLVM 这 样 的 编译 器 。 

对 于 这 些 称 为 “可 重 定向 编译 器 ”的 项 目 ， 需 要 协调 多 个 目标 的 代码 生成 ， 而 这 面临 更 
多 的 挑战 。 应 对 这 些 挑战 最 为 关键 的 一 项 技术 是 使 用 通用 的 中 间 表 示 (IR)， 在 这 里 ， 不 同 
的 后 端 能 共享 对 源 程序 的 相同 理解 ， 然 后 再 将 该 IR 代码 转换 为 相应 的 机 器 代码 。 使 用 通用 
的 IR 也 人 允许 不 同 的 后 端 目标 代码 生成 器 受益 于 与 目标 代码 无 关 的 相同 优化 ， 但 是 这 也 会 给 
IR 的 设计 带 来 一 定 的 复杂 度 ， 因 为 IR 需要 保留 一 定 的 抽象 层级 ， 以 避免 过 度 依 赖 某 个 特定 
的 机 器 。 与 此 同时 ， 由 于 较 高 级 的 抽象 会 妨碍 编译 器 针对 目标 机 器 进行 特定 的 优化 ， 因 此 高 
质量 的 可 重 定向 编译 器 也 会 使 用 其 他 IR 来 执行 更 低级 别 的 优化 。 

LLVM 项 目 开 始 于 一 个 比 Java 字 节 码 更 低 抽 象 级 别 的 人， 这 也 是 其 缩写 低级 虚拟 机 
(Low Level Virtual Machine) 的 由 来 。 该 项 目的 起 初 想法 是 探索 低层 级 的 优化 方法 ， 并 采用 


链接 时 优化 。 链 接 时 优化 是 通过 将 IR 写 人 磁盘 来 实现 的 ， 与 字 节 码 的 表示 类 似 。 字 节 码 允 
许 用 户 在 同一 文件 中 合并 多 个 模块 ， 然 后 应 用 过 程 间 优化 。 以 这 种 方式 ， 代 码 优化 可 以 作用 
于 多 个 编译 单元 ， 如 同 它们 在 同一 个 模块 中 一 样 。 

在 第 3 章 中 ,我 们 提 到 LLVM 现在 既 不 是 Java 竞争 对 手 ， 也 不 是 一 个 虚拟 机 ， 而 且 它 
还 有 其 他 的 中 间 表 示 来 提升 效率 。 例 如 ， 除 了 依赖 LLVM IR 来 进行 目标 无 关 优 化 之 外 ， 如 
果 程 序 使 用 MachineFunction 和 MachineInstr 类 来 表示 ， 则 每 个 后 端 代 码 生 成 器 还 
可 能 进行 目标 相关 的 代码 优化 ， 这 两 个 类 直接 使 用 了 目标 机 器 指令 来 表示 源 程序 。 

男 一 方面 ，Function 和 Instruction 类 是 目前 为 止 最 重要 的 类 ， 因 为 它们 代表 多 个 
编译 目标 间 共 享 的 通用 IR。 该 民 是 LLVM 的 官方 中 间 表 示 ， 而且 大 多 数 (但 不 是 全 部 ) 是 目 
标 无 关 的 。 由 于 LLVM 中 也 有 其 他 中 间 层 级 去 描述 程序 ， 在 技术 上 也 可 以 称 之 为 也， 为 了 避 
免 混淆 ， 我 们 不 把 它们 称 为 LLVM IR。 在 本 书 中 ，LLVM IR 这 个 术语 专 指 ITnstruction 类 
所 代表 的 不 同 后 端 共享 的 中 间 表 示 。 这 个 界定 也 被 LLVM 的 官方 文档 采用 。 

LLVM 项 目 从 一 系列 围绕 LLVM IR 的 工具 展开 ， 这 证 明 优化 器 的 是 成 熟 的 ， 用 于 本 层 
的 优化 器 数量 是 合理 的 。IR 有 三 种 等 价 的 表达 形式 : 

1. 内 存 表 示 (Instruction 类 等 ) 

2. 被 压缩 的 磁盘 表示 (位 码 文件 ) 

3. 人 工 可 读 文本 的 磁盘 表示 (LLVM 汇编 码 文件 ) 

LLVM 提供 的 工具 和 库 使 你 能 处 理 以 上 所 有 形式 的 IR， 并 且 这 些 工具 能 够 对 IR 进行 不 
同 表示 形式 的 转换 ， 同 时 应 用 优化 ， 如 图 5-1 所 示 。 


转换 阶段 


分 析 阶 段 


Cy 


LLVM IR 
中 间 表 示 





理解 LLVM IR 对 编译 目标 的 依赖 


LLVM IR 被 设计 成 尽 可 能 地 与 编译 目标 无 关 ， 但 它 仍然 对 编译 目标 有 一 定 的 依赖 性 。 
造成 该 依赖 性 的 一 个 普遍 承认 的 原因 是 C/C++ 语言 固有 的 目标 依赖 性 质 。 要 理解 这 一 点 ， 
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可 以 将 在 Linux 系统 中 使 用 标准 C 头 文件 作为 例子 : 程序 会 从 Linux 头 文件 专用 文件 夹 
bits 中 隐 式 导 人 一 些 头 文件 。 此 文件 夹 包 含 目 标 相 关 的 头 文件 ， 这 些 文件 中 有 一 些 宏 定义 
会 强迫 某 些 实体 具有 特定 的 类 型 ， 以 便 与 该 内 核 的 系统 调用 期 望 的 类 型 相 匹配 。 在 导入 头 文 
件 之 后 ， 当 前 端 解析 源 代码 时 ，( 例 如 ) 还 需要 对 int 类 型 使 用 不 同 的 大 小 ， 以 匹配 运行 此 
代码 的 目标 机 器 。 

因此 ， 库 头 文件 和 C 的 类 型 都 已 经 是 依赖 目标 的 ， 这 使 得 要 产生 可 以 在 之 后 被 转换 成 
其 他 目标 的 IR 变 得 很 困难 。 如 果 仅 考虑 依赖 目标 的 C 标准 库 头 文件 ， 则 给 定编 译 单元 的 解 
析 AST 甚至 在 被 转换 为 LLVM IR 之 前 就 已 经 是 依赖 目标 的 。 此 外 ， 前 端 在 生成 IR 代码 时 ， 
需 使 用 与 编译 目标 ABI 相 匹配 的 类 型 大 小 、 调 用 惯例 和 特殊 库 调 用 等 。 尽 管 如 此 ，LLVM 
IR 还 是 非常 灵活 的 ， 具备 抽象 地 应 对 不 同 的 编译 目标 的 能 力 。 


5.2 操作 |R 格式 的 基本 工具 示例 

之 前 我 们 提 到 LLVM IR 可 以 用 两 种 格式 存储 在 磁盘 上 : 位 码 和 汇编 文本 。 我 们 现在 将 
学 习 如 何 使 用 它们 ， 以 sum.c 源 代码 为 例 : 

int sum(int a, int b) { 


return a+b; 


} 

要 使 Clang 生成 位 码 ， 可 以 使 用 以 下 命令 : 

$ clang sum.c -emit-llvm -c -o sum.bc 

要 生成 汇编 文本 ， 可 以 使 用 以 下 命令 : 

$ clang sum.c -emit-llvm -S -c -o sum.11 

还 可 以 汇编 上 述 LLVM IR 汇编 文本 ,创建 相应 的 位 码 : 

$ llvm-as sum.11 -o sum.bc 

相反 ， 要 从 位 码 转 换 为 IR 汇编 文本 ， 可 以 使 用 反 汇 编程 序 : 
$ llvm-dis sum.bc -o sum.11 


通过 llvm 提取 工具 1lvm-extract， 可 以 提取 IR 函数 、 全 局 变量 ， 还 可 以 删除 IR 模 
块 中 的 全 局 变量 。 例 如 ， 使 用 以 下 命令 可 以 从 sum.bc 中 提取 sum 函数 : 


$ llvm-extract -func=sum sum.bc -o sum-fn.bc 


在 此 特定 示例 中 ，sum.bc 和 sum-fn.bc 没有 任何 变化 ， 因 为 sum 已 经 是 此 模块 中 
的 唯一 函数 。 


5.3 LLVM IR 语法 介绍 
观察 LLVM IR 汇编 码 文件 sum.11: 
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target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16- 
i32:32:32-1i64:64:64-f32:32:32-f64:64:64-V64:64:64-V128:128:128- 
a0:0:64-s0:64:64-£f80:128:128-n8:16:32:64-S128" 
target triple = "x86 64-apple-macosx10.7.0" 


define i32 @sum(i32 %a, i32 %b) #0 { 


entry: 
$a.addr = alloca i32, align 4 
$b.addr = alloca i32, align 4 


store i32 %a, i32* %a.addr, align 4 
store i32 %b, i32* %b.addr, align 4 
gs0 = load i32* %a.addr, align 4 

$1 = load i32* %b.addr, align 4 
%add = add nsw i32 %0, %1 

ret i32 %add 


} 


attributes #0 = { nounwind ssp uwtable ... } 


整个 LLVM 文件 的 内 容 (无 论 是 汇编 码 还 是 位 码 ) 被 视 为 定义 一 个 LLVM 模块 。 模 块 
是 LLVM IR 顶层 数据 结构 。 每 个 模块 包含 一 系列 了 清 数 ， 每 个 函数 由 包含 一 系列 指令 的 一 系 
列 基本 块 组 成 。 模 块 还 包含 用 于 支持 该 模型 的 外 围 实体 ， 如 全 局 变量 、 目 标 数据 布局 、 外 部 
函数 原型 以 及 数据 结构 声明 。 
LLVM 局 部 变量 与 汇编 语言 中 的 寄存 器 类 似 ， 可 以 用 任何 以 % 符号 开头 的 名 称 命 名 。 因 
此 ，%add = add nsw i32 %0,，%1 这 一 指令 将 执行 两 个 局 部 变量 $0 和 %1 的 加 法 ， 并 将 
结果 置 于 新 的 局 部 变量 sadd 中 。 用 户 可 以 自由 地 给 这 些 值 命名 ， 甚 至 可 以 只 使 用 数字 。 通 
过 这 个 简短 的 例子 ， 我 们 已 经 可 以 看 到 LLYM 如 何 表达 其 基本 属性 : 
e 它 使 用 静态 单 赋值 ( SSA) 形式 。 请 注意 ， 该 形式 下 每 个 变量 都 不 会 被 重新 赋值 ， 每 
个 变量 只 有 唯一 一 条 定义 它 的 赋值 语句 。 每 次 使 用 一 个 变量 都 可 以 立即 回溯 到 负责 
其 定义 的 唯一 指令 。 使 用 SSA 形式 导致 “使 用 定义 链 ” (use-def 链 ， 即 可 以 达到 使 
用 处 的 所 有 定义 /赋值 语句 的 集合 ) 的 生成 变 得 非常 简单 ， 这 个 简化 操作 具有 巨大 的 
价值 。 使 用 定义 链 是 经 典 优化 (如 常量 传播 和 宛 余 表 达 式 消除 ) 的 前 提 和 条件， 如果 
LLVM 没有 使 用 SSA 形式 ， 则 需要 运行 单独 的 数据 流 分 析 来 计算 使 用 定义 链 。 
e 代码 被 组 织 成 三 地 址 指令 。 数 据 处 理 指 令 有 两 个 源 操 作 数 ， 并 将 结果 放 在 不 同 的 目 
标 操作 数 中 。 
e 有 无 穷 多 的 寄存 器 。 请 注意 ，LLVM 局 部 变量 可 以 使 用 以 符号 开始 的 任意 名 称 ， 
例如 s0 、g#1 等 从 零 开始 的 数字 ， 它 对 局 部 变量 的 最 大 数量 没有 限制 。 
target datalayout 构造 包含 有 关 目 标 机 器 (target host) 中 描述 的 目标 三 元 组 
(target tripple) 的 字 节 顺序 和 类 型 大 小 等 信息 。 有 些 优 化 需要 知道 目标 的 特定 数据 布 
局 才能 完成 正确 的 代码 转换 。 下 面 是 一 个 布局 声明 的 示例 : 


target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16;16:16- 
i32:;32:32-i64:64:64-f32:32:32-f64:64:64-V64:64:64-Vv128:128:128- 
a0:0:64-s0:64:64-£f80:128:128-n8:16:32:64-S128" 
target triple = "x86 64-apple-macosx10.7.0" 
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我 们 可 以 从 该 字符 串 中 提取 以 下 信息 : 

e 目标 机 器 是 装 有 macosx 10.7.0 的 x86 64 处理 器 。 它 具有 小 端 字 节 序 ， 由 target 
datalayout 构造 中 第 一 个 字母 (小写 字母 e) 表示 。 大 端 字 节 序 的 表示 需要 使 用 大 写字 
母 E。 

e 格式 类 型 的 信息 由 如 下 格式 表示 : <size> : <abi> : <preferred>。 在 上 述 示 
例 中 ,“p : 64: 64: 64” 表 示 64 位 宽 的 指针 ，abi 和 首选 对 齐 设 置 为 64 位 边界 。 
ABI 对 齐 指定 了 一 种 类 型 所 需 的 最 小 对 齐 方式 ， 尽 管 首选 对 齐 方式 在 有 益 的 情况 下 
可 以 被 指定 为 一 个 更 大 的 值 。32 位 整数 类 型 “i32 : 32 : 32” 的 大 小 为 32 位 宽 、 
32 位 的 abi 和 首选 对 齐 方式 等 。 

函数 声明 严格 遵循 相应 的 C 语法 : 


define i32 @sum(i32 %a, i32 %b) #0 { 


此 函数 返回 i32 类 型 的 值 ， 并 具有 两 个 i32 参数 : $a 和 sb。 本 地 标识 符 始终 需要 % 
前 级 ， 而 全 局 标识 符 使 用 @。LLVM 支持 多 种 类 型 ， 但 最 重要 的 类 型 如 下 : 

e iN 形式 的 任意 大 小 的 整数 ， 常 见 的 例子 是 i32、i64 和 i128。 

e 浮 点 类 型 ， 如 32 位 单 精度 浮 点 数 float 和 64 位 双 精 度 浮 点 数 double。 

e 问 量 类 型 的 格式 为 <<#elements> x <elementtype>>。 包 含 四 个 i32 元 素 的 向 

量 被 写 为 <4 x i32>。 

函数 声明 中 的 #0 记号 映射 到 一 组 函数 属性 ， 这 与 C/C++ 函数 和 方法 中 使 用 的 属性 非常 

类 似 。 这 组 属性 被 定义 在 文件 末尾 : 


attributes #0 = { nounwind ssp uwtable "less-precise- 
fpmad"="false" "no-frame-pointer-elim'"="true" "no-frame-pointer- 
elim-non-leaf"="true" "no-infs-fp-math"="false" "no-nans-fp- 
math"="false" "unsafe-fp-math"="false" "use-soft- 
float"="false'" } 


例如 ， 上 述 例子 中 的 nounwind 属性 表示 函数 或 者 方法 未 抛 出 异常 ， 而 ssp 属性 告诉 
代码 生成 器 使 用 栈 粉碎 保护 器 (stack smash protector) 来 增加 该 代码 的 安全 性 ， 以 防止 攻击 。 
函数 的 主体 部 分 明确 划分 为 多 个 基本 块 (basic block, BB)， 而 每 个 新 的 基本 块 开始 处 都 
有 一 个 标签 。 标 签 与 基本 块 的 关系 就 如 同 变量 标识 符 与 指令 。 如 果 一 个 基本 块 省 略 了 标签 声 
明 ， 则 LLVM 汇编 器 会 自动 使 用 自己 的 命名 机 制 为 其 生成 一 个 标签 声明 。 每 个 基本 块 都 包 
含 一 系列 指令 ， 在 第 一 条 指令 处 有 一 个 人口 点 ， 在 最 后 一 条 指令 处 有 一 个 出 口 点 。 这 样 ， 当 
代码 跳 转 到 对 应 于 基本 块 的 标签 时 ， 我 们 就 可 以 知道 它 将 执行 这 个 基本 块 中 的 所 有 指令 ， 直 
到 最 后 一 条 指令 ， 之 后 跳 转 到 另 一 个 基本 块 来 改变 控制 流 。 基 本 块 及 其 关联 的 标签 需要 符合 
以 下 条 件 : 
。 每 个 基本 块 都 需要 以 一 个 结束 符 指 令 结尾 ， 结 束 符 一 般 为 跳 转 到 另 一 个 基本 块 或 从 
该 函数 返回 。 
e 第 一 个 基本 块 称 为 和 人口 基本 块 ， 它 在 LLVM 函数 中 的 地 位 很 特殊 ， 不 能 作为 任何 分 
支 指令 的 目标 。 
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示例 中 的 LLVM 文件 sum.11 只 有 一 个 基本 块 ， 因 为 它 没有 跳 转 、 循 环 或 调用 。 函 数 
的 开始 使 用 entry 标签 ， 而 使 用 返回 指令 ret 结束 : 


entry: 
%a.addr = alloca i32, align 4 
$b.addr = alloca i32, align 4 
store i32 %a, i32* %a.addr, align 4 
store i32 %b, i32* %b.addr, align 4 
%0 = load i32* $%a.addr, align 4 
%1 = load i32* %b.addr, align 4 
sadd = add nsw i32 %0, %1 
ret i32 $add 


alloca 指令 在 当前 函数 的 堆栈 帧 中 保留 一 定 的 空间 。 空 间 的 大 小 由 元 素 类 型 的 大 小 决 
定 ， 它 遵循 特定 的 对 齐 方式 。 第 一 条 指令 $a.addr=alloca i32，align 4 分 配 一 个 
按 4 字 节 对 齐 的 4 字 节 堆栈 元 素 。 指 向 该 堆栈 元 素 的 指针 被 存储 在 本 地 变量 sa.addz 中 。 
alloca 指令 通常 用 于 表示 本 地 (自动 ) 变量 。 

sa 和 %b 参数 通过 store 指令 存储 在 堆栈 地 址 sa.addr 和 %b.addr 中 。 这 些 值 通 
过 load 指令 从 相同 的 内 存 地 址 加 载 回来 ， 并 在 sadd=add nsw i32%0,%1 加 法 中 使 用 。 
最 后 ， 函 数 返 回 加 法 结果 sadd。nsw 标识 指定 此 加 法 操作 具有 “no signed wrap”， 这 
表示 已 知 指令 是 无 溢出 的 ， 从 而 允许 进行 一 些 优化 。 如 果 你 对 nsw 标志 背后 的 历史 感 兴趣 ， 
可 以 扩展 阅读 Dan Gohman 的 LLVMdev 贴 子 : 

http://lists.cs.uiuc.edu/pipermail/llvmdev/2011-November/ 
045730.html。 

实际 上 ， 示 例 中 的 1oad 和 store 指令 是 多 余 的 ，add 指令 可 以 直接 使 用 也 数 参数 。 
Clang 默认 使 用 -00 (无 优化 )， 不 必要 的 加 载 和 存储 不 会 被 删除 。 如 果 我 们 用 -ol 编译 ， 
结果 会 是 一 个 更 加 简单 的 代码 : 


define i32 @sum(i32 %a, i32 %b) ... { 
entry: 

$add = add nsw i32 %b, $%a 

ret i32 $add 


) 


在 编写 测试 目标 后 端的 小 程序 时 ， 直 接 使 用 LLVM 汇编 码 非常 方便 ， 这 也 是 学 习 基 本 
LLVM 概念 的 方法 之 一 。 但 是 ， 库 仍然 是 前 端 程序 员 构 造 LLVM IR 的 推荐 接口 ， 这 是 下 一 
节 的 主题 。 可 以 从 http://1llvm.org/docs/LangRef.html 找到 有 关 LLVM IR 汇编 
语法 的 完整 参考 。 


LLVM IR 内 存 模 型 介绍 


LLVM IR 在 内 存 中 的 表示 形式 与 之 前 呈现 的 LLVM 语言 语法 紧密 关联 。 表 示 IR 的 C++ 
类 的 头 文件 位 于 include/11vm/IR。 以 下 列 出 最 重要 的 类 : 
e Module 类 聚合 了 整个 编译 过 程 中 使 用 的 所 有 数据 ， 它 是 LLVM 术语 中 “模块 ”的 
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同义词 。 它 声明 了 Modqule: :iterator， 可 以 用 于 快速 遍历 该 模块 中 的 所 有 函数 。 
你 可 以 通过 begin() 和 end( ) 方法 获得 这 些 和 迭代 器 。 该 类 的 完整 接口 可 以 通过 下 
列 网 址 查看 : 
国 http://1L1Vvm.org/docs/doxygen/html/c1lLass11vm 1 lModule.html 
e Function 类 包含 与 函数 定义 或 声明 有 关 的 所 有 对 象 。 在 声明 的 情况 下 (使 用 
isDeclaration() 方 法 来 检查 它 是 否 是 声明 )， 它 只 包含 函数 原型 。 在 两 种 情 
况 下 ， 它 都 包含 函数 参数 列表 ， 可 以 通过 getArgumentList() 方 法 或 arg_ 
begin() 与 arg_end() 方 法 获得 此 列表 。 可 以 使 用 Function::arg iterator 
定义 类 型 来 遍历 它们 。 如 果 Function 对 象 表 示 一 个 函数 定义 ， 并 且 通 过 for 
(Function: :iterator i= function.begin(),e=function.end();i! = 
e; ++ IE) 来 遍历 其 内 容 ， 将 跨 其 基本 块 执行 遍历 。 该 类 的 完整 接口 可 以 通过 如 下 地 址 
查看 : 
加 http://llvm.org/docs/doxygen/html/classllvm 1 lFunction. 
html 
e BasicBlock 类 封装 了 一 系列 LLVM 指令 ， 可 通过 begin()/ end() 进行 访问 。 
用 户 可 以 使 用 getTerminator() 方法 直接 访问 其 最 后 一 条 指令 ， 或 者 是 通过 一 些 
方法 访问 CFG ( control flow graph， 控 制 流 图 )。 例 如 ， 当 基本 块 只 有 一 个 前 导 基 本 
块 时 ， 可 以 通过 getsinglePredecessor() 访问 前 一 个 基本 块 。 但 是 ， 如 果 它 包 
含 多 个 前 导 基 本 块 ， 则 需要 自己 计算 其 前 导 基 本 块 列表 ,通过 遍历 基本 块 并 检查 其 
终止 指令 的 目标 ， 可 以 获得 该 列表 。 该 类 的 完整 接口 可 以 通过 如 下 地 址 查看 : 
国 http://llvm.org/docs/doxygen/html/classllvm 1 lBasicBlock. 
html 
e Instruction 类 表示 LLVM IR 中 最 小 的 基本 单元 ， 即 一 条 指令 。 它 有 一 些 快速 
获取 指令 高 层次 信息 的 方法 ， 比 如 asAssociative()、isCommutative()、 
isIdempotent() 或 isTerminator()。 指 令 的 操作 码 可 以 用 getopcode( ) 来 
获取 ， 它 返回 的 是 11vm: :Instruction 枚 举 的 成 员 ， 代表 LLVM IR 操作 码 。 通 
过 op_begin() 和 op_end() 方法 ， 可 以 遍历 它 的 操作 数 ， 这 两 个 方法 从 下 面 会 
提 到 的 User 超 类 继承 而 来 。 该 类 的 完整 接口 可 以 通过 如 下 地 址 查看 : 
国 http://11vm.org/docs/doxygen/html/classl11L1vm_ 1 _1Instruction。 
html 
接 下 来 介绍 LLVM IR 中 由 SSA 形式 带 来 的 最 强大 的 两 个 类 : Value 和 User 类 。 通 
过 它们 ， 可 以 轻松 访问 use-def 和 def-use 链 。 在 LLVM IR 内 存 形式 中 ， 从 Value 继 
承 的 类 意味 着 该 类 定义 了 可 以 被 其 他 指令 使 用 的 结果 ， 而 User 的 子 类 则 意味 着 该 类 使 用 一 
个 或 多 个 Value 接口 。Function 和 Instruction 同时 是 Value 和 User 的 子 类 ,而 
BasicBlock 仅仅 是 value 的 子 类 。 为 了 理解 这 一 点 ， 我 们 来 深入 分 析 这 两 个 类 : 
e Value 类 定义 了 人 use begin() 和 use_end() 方 法 ， 用 于 遍历 User， 从 而 为 访问 
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它 的 def-use 链 提 供 了 简单 方法 。 对 于 每 个 Value 类 ， 还 可 以 通过 getName() 方 
法 访问 其 名 称 。 这 符合 任何 LLVM 变量 都 可 以 具有 与 其 相关 的 明确 标识 这 一 情况 。 例 
如 ， saddl 可 以 定义 一 个 加 法 指令 的 结果 ，BB1 可 以 定义 一 个 基本 块 , myfunc 可 以 标 
识 一 个 函数 。Value 也 有 一 个 强大 的 方法 , 称 为 replaceAllUsesWith(Value*)， 
它 可 以 遍历 该 值 的 所 有 使 用 者 ， 并 用 其 他 值 取 代 它 。 这 是 一 个 很 好 的 SSA 表示 形式 的 
例子 ， 使 得 你 可 以 轻松 地 替换 指令 ， 并 快速 编写 优化 。 该 类 的 完整 接口 可 以 通过 如 下 
地 址 查看 : 

国 http://llvm.org/docs/doxygen/html/classllvm 1 lValue.html 
User 类 具有 op _begin() 和 op_end() 方法 ， 它 们 人 允许 快速 访问 它 使 用 的 所 
有 Value 接口 。 请 注意 ， 这 个 关系 对 应 的 是 use-def 链 。 用 户 也 可 以 使 用 名 为 
replaceUsesOfWith(Value *From,Value *To) 的 方法 来 替换 它 使 用 的 任何 
值 。 该 类 的 完整 接口 可 以 通过 如 下 地 址 查看 : 

国 http://1L1Lvm.org/docs/doxygen/html/Vclass1L1vm_ 1 lUser.html 


编写 自 定 义 的 LLVM IR 生成 器 


可 以 使 用 LLVM IR 生成 器 API 以 编程 方式 为 sum.11 构建 阴 (在 -00 优化 级 别 创建 ， 
即 不 进行 优化 )。 在 这 一 节 ， 我 们 将 逐步 阐述 该 过 程 。 首 先 来 看 所 需 的 头 文件 : 


#include <llvm/ADT/SmallVector.h> : 该 头 文件 定义 模板 类 smallvVector<>， 
当 元 素数 量 不 大 时 ， 可 以 构建 高 效 的 向 量 数据 结构 。 请 参阅 http://1llvm.org/ 
docs/ProgrammersManual .html 以 获取 关于 LLVM 数据 结构 的 帮助 。 
#include <llvm/Analysis/Verifier.h> : 它 提供 一 个 重要 的 程序 验证 分 析 ， 
即 检查 当前 的 LLVM 模块 是 否 与 IR 语法 规则 相符 。 

#include <llvm/IR/BasicBlock.h> : 它 是 声明 BasicBlock 类 的 头 文件 ， 
该 类 是 我 们 已 经 介绍 过 的 重要 的 IR 实体 。 

#include <llvm/IR/CallingConv.h> : 这 个 头 文件 定义 在 函数 调用 中 使 用 的 
一 组 ABI 规则， 比如 函数 参数 的 存储 位 置 。 

#include <llvm/IR/Function.h> : 这 个 头 文件 声明 Function 类 ， 也 是 一 
个 重要 的 IR 实体 。 

#include <llvm/IR/Instructions.h> : 这 个 头 文件 声明 Instruction 类 
的 所 有 子 类 ， 这 是 IR 的 基本 数据 结构 。 

#include <11vm/IR/LLVMContext.h> : 这 个 头 文件 存储 LLVM 库 的 所 有 全 局 
作用 范围 的 数据 ， 它 允许 多 线程 版 本 在 每 个 线程 中 使 用 不 同 的 上 下 文 。 

#include <llvm/IR/Module.h> : 这 个 头 文件 声明 Module 类， 它 是 凡 层次 
结构 中 的 顶层 实体 。 

#include <llvm/Bitcode/ReaderWriter.h> : 这 个 头 文件 包含 用 于 读 取 和 
写 入 LLVM 位 码 文件 的 代码 。 
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e #include <llvm/Support/ToolOutputFile.h> : 这 个 头 文件 声明 一 个 用 于 
帮助 我 们 写 人 输出 文件 的 类 。 
在 这 个 例子 中 ， 我 们 也 从 LLvm 命名 空间 中 导入 符号 : 


using namespace llvm; 


之 后 我 们 分 步骤 编写 代码 : 
1. 要 编写 的 第 一 段 代 码 是 定义 一 个 名 为 makeLLVMModule 的 新 辅助 函数 ， 它 返回 指向 
Module 实例 的 指针 ,该 Module 实例 是 包含 所 有 其 他 IR 对 象 的 顶层 实体 : 
Module *makeLLVMModule() { 
Module *mod = new Module("sum.1l1", getGlobalContext () ) ; 
mod->setDataLayout ("e-p:64:64:64-il1:8:8-i8:8:8-i16:16:16- 
i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64- 
V128:128:128-a0:0:64-s0:64:64-f80:128:128- 
n8:16:32:64-S128"); 
mod->setTargetTriple ("x86 64-apple-macosx10.7.0"); 
如 果 我 们 将 三 元 组 和 数据 布局 对 象 放 入 我 们 的 模块 中 ， 将 使 依赖 此 信息 的 代码 优化 成 
为 可 能 ， 但 是 这 需要 匹配 在 LLVM 后 端 中 使 用 的 用 于 表示 三 元 组 和 数据 布局 的 字符 串 。 不 
过 ， 如 果 不 关 心 依 赖 于 布局 的 代码 优化 ， 并 打算 明确 指定 将 在 后 端 使 用 的 目标 ， 则 可 以 将 
这 些 内 容 从 模块 中 移出 。 要 创建 模块 ， 可 以 通过 getGlobalcontext() 获取 当前 LLVM 
上 下 文 ， 并 定义 模块 的 名 称 。 这 里 我 们 使 用 示例 文件 的 名 称 sum.11 作为 模块 名 称 ， 但 
你 可 以 选择 其 他 模块 名 称 。 上 下 文 是 LLVMContext 类 的 一 个 实例 ， 为 了 保证 线程 安全 ， 
必须 使 用 该 实例 ， 因 为 多 线程 IR 的 生成 必须 按 每 个 线程 对 应 一 个 上 下 文 来 完成 。 此 外 ， 
setDataLayout() 和 setTargetTriple() 函数 允许 我 们 设置 相应 的 字符 串 ， 以 定义 
模块 的 数据 布局 和 目标 三 元 组 。 
2. 为 了 声明 求 和 函数 ， 首 先 定 义 如 下 函数 签名 : 


SmallVector<Type*, 2> FuncTyArgs; 
FuncTyArgs.push back (IntegerType: :get (mod->getContext () ， 
基于 


FuncTyArgs.push back (IntegerType: :get (mod->getContext () ， 
32) )} 

FunctionType *FuncTy = FunctionType::get!( 
/*Result=*/ IntegerType::get (mod->getContext (), 32), 


/*Params=*/ FuncTyArgs, /*isVarArg=*/ false); 


上 面 代码 中 的 FunctionType 对 象 指定 了 一 个 函数 ， 该 函数 返回 一 个 32 位 整数 类 型 ， 
没有 可 变 参 数 ， 并 有 两 个 32 位 整数 参数 。 

3. 接 下 来 我 们 使 用 Function: :Create() 静态 方法 创建 一 个 函数 ， 这 需要 使 用 之 前 
创建 的 函数 类 型 FuncTy、 链 接 类 型 和 模块 实例 。GlobalValue: :ExternalLinkage 
枚 举 成 员 意 味 着 该 函数 可 以 被 其 他 模块 (编译 单元 ) 引用 : 


Function *funcSum = Function::Createl 
/*Type=*/ FuncTy, 
/*Linkage=*/ GlobalValue: :ExternalLinkage, 
/*Name=*/ "sum'", mod); 
funcSum->setCallingConv (CallingCconv: :C) : 


4. 接 下 来 ， 我 们 需要 存储 参数 的 Value 指针 ， 以 便 以 后 使 用 它们 。 为 此 ,我 们 使 用 函 
数 参数 的 迭代 器 。int32_a 和 int32_b 两 个 函数 参数 分 别 指向 第 一 个 和 第 二 个 参数 。 我 
们 还 设置 了 每 个 参数 的 名 称 ， 这 是 可 选 的 ， 因 为 LLVM 可 以 提供 临时 名 称 : 


Function::arg iterator args = funcSum->arg begin(); 
Value *int32 a = args++; 

int32 a->setName ("a"); 

Value *int32 b = args++; 

int32 b->setName("b"); 


5. 在 开始 函数 体 之 前 ,我 们 用 entry 标签 (或 值 名 称 ) 创建 第 一 个 基本 块 ， 并 在 


labelEntry 中 存储 它 的 指针 。 创 建 该 基本 块 需要 传递 对 其 所 在 函数 的 引用 ， 如 下 面 代码 
所 示 : 


BasicBlock *labelEntry = BasicBlock::Create (mod- 
>getContext(), "entry", funcSum, 0); 


6. 这 时 ，entry 基本 块 已 经 准备 好 添加 指令 。 我 们 向 基本 块 添加 两 条 alloca 指令 ， 
以 创建 一 个 4 字 节 对 齐 的 32 位 堆栈 元 素 。 在 指令 的 构造 函数 中 ， 需 要 传递 对 其 所 在 基本 块 
的 引用 。 默 认 情况 下 ， 新 的 指令 被 插 人 基本 块 的 末尾 ， 如 下 所 示 : 


// Block entry (label entry) 

AllocaInst *ptrA = new AllocalInst (IntegerType::get (mod- 
>getContext (), 32), "a.addr", labelEntry); 

ptrA->setAlignment (4) ; 

AllocaInst *ptrB = new AllocaInst (IntegerType: :get (mod- 
>getContext(), 32), "b.addr", labelEntry); 

ptrB->setAlignment (4); 


< ， 或者， 也 可 以 使 用 名 为 IRBuilder<> 的 辅助 模板 类 来 构建 IR 指令 (请 参阅 

Q http://llvm.org/docs/doxygen/html/classllvm 1_ 1IRBuilder. 
html)。 但 是 ， 这 里 没有 使 用 该 模板 类 ， 这 是 为 了 呈现 原始 接口 。 如 果 你 想 使 用 
它 ， 只 需要 引入 111m/IR/IRBuilder.h 头 文件 ， 并 用 LLVM 上 下 文 对 象 实 
例 化 它 ， 然 后 调用 SetInsertPoint() 方法 来 定义 想 要 放置 新 指令 的 地 方 。 之 
后 ， 只 需 调 用 任意 指令 创建 方法 ， 比 如 CreateRlloca()。 


7. 我 们 使 用 alloca 指令 返回 的 指针 ptrA 和 ptrB 将 int32 a 和 int32_b 函数 参 
数 存 储 到 堆栈 位 置 中 。 虽 然 存储 指令 在 以 下 代码 中 由 st0 和 st1 引用 , 但 是 这 些 指 针 在 这 
个 例子 中 从 不 使 用 ， 因 为 存储 指令 没有 返回 结果 。 第 三 个 storeInst 参数 指定 这 是 否 是 一 
个 非 静 态 存储 区 ， 在 此 示例 中 为 false: 


StoreInst *st0 = new StoreInst (int32 a, ptrA, false, 
labelEntry); 

st0->setAlignment (4) ; 

StoreInst *St1 = new StoreInst (int32 b, ptrB, false, 
labelEntry); 

st1l->setAlignment (4) ; 


8. 我 们 还 创建 静态 加 载 指令 ， 从 堆栈 位 置 1da0 和 1dl 中 将 值 加 载 回来 。 然 后 将 这 些 值 
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用 作 加 法 指令 的 参数 执行 加 法 ， 并 将 加 法 结果 addRes 设置 为 sum 函数 的 返回 值 。 接 下 来 ， 
makeLLVMModule 函数 返回 LLVM IR 模块 和 我 们 刚 创 建 的 sum 函数 : 


LoadIinst *]1d0 = new LoadInst (ptrA, "", false, 
labelEntry); 

1d0->setAlignment (4) ; 

LoadInst *1dl = new LoadInst (ptrB, "", false, 
labelEntry); 


ld1l->setAlignment (4) ; 
BinaryOperator *addRes = 
BinaryOperator: :Create(Instruction::Add, 1d0, 1dl1, 
"add", labelEntry); 
ReturnIinst::Create (mod->getContext (), addRes, 
labelEntry); 


return mod; 


每 个 指令 创建 函数 都 有 很 多 的 变化 形式 。 请 参阅 include/11lvm/IR 中 的 头 文 
~ 件 或 doxygen 文档 来 检查 所 有 可 能 的 选项 。 


9. 为 了 使 生成 器 程序 成 为 一 个 独立 的 工具 ， 它 还 需要 一 个 main( ) 函数 。 在 main( ) 
函数 中 ， 我 们 通过 调用 makeLLVMModule 创建 一 个 模块 ， 并 使 用 verifyModule() 
验证 IR 构造 。 如 果 验 证 失败 ，PrintMessageRction 枚 举 成 员 将 错误 消息 设置 为 stderr。 
最 后 ， 通 过 WriteBitcodeToFile 函数 将 模块 的 位 码 写 人 磁盘 ， 如 下 面 的 代码 所 示 


int main() { 

Module *Mod = makeLLVMModule () ; 

verifyModule(*Mod, PrintMessageAction); 

std: :string ErrorIinfo; 

OwningPtr<tool output file> Out (new tool output filel( 
./sum.bc", ErrorIinfo, 


sys:fs::F None)); 
if (!ErrorIinfo.empty()) { 
errs() << ErrorIinfo << '\n'; 
return -1; 


} 

WriteBitcodeToFile (Mod, Out->os()); 
Out->keep(); // Declare success 
return 0; 


5.4.1 构建 和 运行 |R 生成 器 


构建 上 述 IR 生成 器 可 以 使 用 第 3 章 中 提 到 的 相同 Makefile。Makefile 中 最 关键 的 部 分 
是 11vm-config 一 libs 调用 ， 它 定义 了 我 们 的 项 目 将 要 链接 的 LLVM 库 。 在 这 个 项 目 中 ， 
我 们 将 使 用 bitwriter 组 件 ， 而 不 是 在 第 3 章 中 使 用 的 bitreader 组件。 因此 ， 请 将 
llvm-config 调用 更 改 为 11vm-config 一 libsbitwriter core support。 要 构建 、 
运行 并 检查 生成 的 IR， 请 使 用 以 下 命令 : 
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$ make && ./sum && llvm-dis < sum.bc 


define i32 @sum(i32 %a, i32 %b) { 
entry: 
%a.addr = alloca i32, align 4 
%b.addr = alloca i32, align 4 
Store i32 %a, i32* %a.addr, align 4 
store i32 %b, i32* %b.addr, align 4 
%0 = load i32* %a.addr, align 4 
%1 = load i32* %b.addr, align 4 
%add = add i32 %0, %1 
ret i32 %add 


} 


5.4.2 使 用 C++ 后 端 编写 代码 来 生成 |R 构造 


第 6 章 将 详细 介绍 的 11c 工具 有 一 项 有 趣 的 功能 ， 可 以 帮助 生成 I 民 。11c 工具 能 够 从 
给 定 LLVM IR 文件 生成 对 应 的 C++ 源 代 码 ， 该 C++ 代码 也 可 以 生成 相同 的 IR 文 件 。 这 使 
得 用 于 构建 IR 的 API 更 加 易于 使 用 ， 因 为 你 可 以 通过 现 有 的 IR 文件 来 学 习 如 何 构建 复杂 
的 IR 表达 式 。LLVM 通过 C++ 后 端 来 实现 这 一 点 ， 主 要 的 工具 是 带 有 -march=cpp 参数 
的 11c 工具 : 


$ llc -march=cpp sum.bc -o sum.cpp 


读者 打开 sum.cpp 文件 可 以 观察 到 生成 的 C++ 代码 与 在 前 一 节 编 写 的 代码 非常 相似 。 


AC 为 所 有 目标 配置 LLVM 时 ,默认 会 包含 C++ 后 端 。 但 是 ， 如 果 在 配置 期 间 指 定 
~ 了 目标 ， 则 还 需要 手动 包含 C++ 后 端 。 例 如 ， 使 用 cpp 后 端 名 称 来 包含 C++ 后 


端 ; --enable-targets=x86,arm,mips,cpp。 


5.5 在 IR 层 执行 优化 


程序 一 旦 翻译 成 LLVM IR， 就 可 以 进行 各 种 与 目标 无 关 的 代码 优化 。 这 些 代 码 优化 可 
以 在 每 个 函数 或 者 每 个 模块 上 进行 ， 后 者 可 以 进行 跨 函 数 的 代码 优化 。 为 了 增强 过 程 间 优化 
的 影响 ， 用 户 可 以 使 用 11vm-1Link 工具 将 多 个 LLVM 模块 链接 成 一 个 模块 。 这 使 得 优化 
器 能 够 作用 于 更 大 的 范围 ， 有 时 也 称 为 链接 时 优化 ， 因 为 编译 器 需要 支持 编译 单元 边界 外 的 
代码 优化 。LLVM 用 户 可 以 访问 所 有 这 些 优化 ， 还 可 以 使 用 opt 工具 分 别 调用 它们 。 


5.5.1 编译 时 优化 和 链接 时 优化 


opt 工具 使 用 与 Clang 编译 器 中 相同 的 一 组 优化 标志 : -00、-01、-02、-03、-0s 
和 -0z。Clang 也 支持 -04， 但 opt 不 支持 。-04 标志 是 使 用 链接 时 优化 ( -flito) 的 -03 
的 同义词 ， 但 正如 之 前 所 解释 的 ,在 LLVM 中 启用 链接 时 优化 取决 于 输入 文件 的 组 织 方式 。 
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每 个 编译 标志 都 会 激活 不 同 的 代码 优化 流程 ， 每 个 流程 都 包含 一 组 按 特 定 顺序 执行 的 优化 。 
Clang 手册 文件 中 的 说 明 如 下 : 

“ -Ox 标志 : 指定 要 使 用 的 优化 级 别 。-00 表示 “无 优化 ”: 该 级 别 编译 速度 最 快 ， 并 生 
成 与 原始 代码 行为 最 接近 、 便 于 调试 的 代码 。-02 是 一 个 适中 的 优化 级 别 ， 它 实现 大 部 分 
优化 。-Os 与 -02 类 似 ， 它 运用 额外 的 优化 减少 代码 大 小 。-Oz 也 类 似 于 -Os (因此 也 类 似 
于 -02 )， 它 进一步 优化 了 代码 的 大 小 。-03 与 -02 相似 ， 不 同 之 处 在 于 它 支持 的 编译 需要 
较 长 时 间 才 能 完成 ， 或 者 可 能 生成 更 大 的 代码 (以 便 使 程序 运行 得 更 快 )。 在 受 支 持 的 平台 
上 ，-04 支持 链接 时 优化 ; 目标 文件 以 LLVM 位 码 文件 格式 存储 ， 整 个 程序 的 优化 在 链接 时 
完成 。-O1 在 某 些 地方 介 于 -00 和 -02 之 间 。 

通过 启动 opt 工具 ， 可 以 使 用 上 述 任何 一 个 预定 义 的 优化 ，opt 的 处 理 对 象 是 位 码 文 
件 。 例 如 ， 以 下 示例 使 用 opt 优化 位 码 sum.bc: 


$ opt -03 sum.bc -o sum-03.bc 
也 可 以 使 用 一 个 标志 来 激活 标准 的 编译 时 优化 : 
$ opt -std-compile-opts sum.bc -o sum-stdc.bc 


或 者 ， 可 以 使 用 一 组 标准 的 链接 时 优化 : 
$ llvm-link filel.bc file2.bc file3.bc -o=all.bc 
$ opt -std-link-opts all.bc -o all-stdl.bc 


opt 工具 也 支持 单独 的 代码 优化 流程 (pass)。 其 中 一 个 非常 重要 的 LLVM 流程 是 
mem2reg， 它 会 将 allocs 指令 提升 为 LLVM 局 部 变量 ， 如 果 这 些 指 令 在 转换 为 局 部 变 
量 时 有 多 个 赋值 语句 ， 则 有 可 能 将 其 转换 为 SSA 形式 。 这 种 情况 下 ， 转 换 涉 及 phi 函数 的 
使 用 (请 参阅 http://llvm.org/doxygen/classllvm 1 1PHINode.html)， 这 
些 函 数 在 生成 SSA 形式 的 LLVM IR 时 是 必 不 可 少 的 ， 但 很 难 自行 构建 。 因 此 ， 我 们 建议 
先 依赖 于 alloca、1load 和 store 指令 编写 次 优 代 码 ， 然 后 再 使 用 mem2reg 优化 进行 
SSA 版 本 的 代码 生成 ， 这 正 是 我 们 在 前 一 节 中 对 sum.c 文件 进行 的 优化 。 在 下 面 的 例子 
中 ， 我 们 首先 运行 mem2reg， 然 后 计算 模块 中 每 种 指令 的 数量 ,注意 ,命令 的 参数 顺序 很 
重要 : 


$ opt sum.bc -mem2reg -instcount -o Sum-tmp .bc -stats 


1 instcount - Number of Add insts 

1 instcount - Number of Ret insts 

1 instcount - Number of basic blocks 

2 instcount - Number of instructions (of all types) 


1 instcount - Number of non-external functions 
2 mem2reg - Number of alloca's promoted 


2 mem2reg - Number of alloca's promoted with a single store 


上 述 例子 使 用 -stats 标志 来 强制 LLVM 打印 关于 每 个 流程 的 统计 人 信息。 否则， 指令 
计数 流程 完成 后 默认 不 输出 指令 的 数量 。 
我 们 还 可 以 使 用 -time-passes 标志 来 统计 每 次 优化 需要 的 执行 时 间 : 


$ opt sum.bc -time-passes -domtree -instcount -o sum-tmp.bc 


通过 下 述 链接 可 以 找到 LLVM 分 析 、 变 换 和 辅助 流程 的 完整 列表 : http://1llvm. 


org/docs/Passes .html。 


和 编译 器 中 的 优化 顺序 性 问题 是 指 对 代码 进行 优化 的 顺序 对 最 后 生成 的 代码 性 能 

~ 有 很 大 的 影响 ， 并 且 每 个 程序 都 有 不 同 的 最 优 顺 序 使 得 最 后 的 运行 效果 最 好 。 这 
里 想 指 出 的 是 ， 预 定义 的 一 系列 优化 (使 用 -Ox 标志) 可 能 不 是 程序 的 最 佳 选 
择 。 你 可 以 做 一 个 简单 的 验证 实验 : 运行 两 次 opt -03 优化 代码 ， 观 察 最 后 性 
能 与 只 运行 一 次 -03 相 比 有 多 少 不 同 (不 一 定 更 好 )。 


5.5.2 发现 最 佳 编 译 器 流程 


代码 优化 通常 由 分 析 流 程 (analysis pass) 和 变换 流程 (transform pass) 组 成 。 前 者 进 
行 属性 和 优化 空间 相关 的 分 析 ， 同 时 产生 后 者 需要 的 数据 结构 。 两 者 都 是 LLVM 编译 流程 ， 
并 且 相 互 依赖 。 

在 我 们 的 sum.11 例子 中 ，-00 的 优化 级 别 导致 最 终 代 码 使 用 了 alloca、load 和 
store 指令 。 然 而 ，-01 级 别 的 优化 通过 mem2reg 消除 了 这 些 宛 余 指 令 。 但 是 ， 如 果 你 不 
知道 mem2reg 是 重要 的 ， 那 么 应 该 如 何 寻 找 对 程序 性 能 有 影响 的 流程 ?为 了 理解 这 一 点 ， 
我 们 调用 无 优化 版 本 sum-00 .11 和 优化 版 本 sum-01 .11。 要 构建 后 者 ， 可 以 使 用 -ol 优 
化 标志 : 

$ opt -ol sum-00.11 -8 -o sum-ol.11 

但 是 ， 如 果 想 获得 更 多 有 关 哪 些 变 换 流程 对 结果 产生 实际 影响 的 细 粒 度 信息 ， 可 以 
将 -print-stats 选项 传递 给 clang 前 端 (或 者 将 -stats 传递 给 opt): 


$ clang -Xclang -print-stats -emit-llvm -01 sum.c -c -o sum-Ol.bc 


1 cgscc-passmgr - Maximum CGSCCPassMgr iterations on one SCC 


1 functionattrs - Number of functions marked readnone 
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2 mem2reg - Number of alloca's promoted with a single store 
1 reassociate - Number of insts reassociated 

1 sroa - Maximum number of partitions per alloca 

2 sroa - Maximum number of uses of a partition 

4 sroa - Number of alloca partition uses rewritten 

2 sroa - Number of alloca partitions formed 

2 sroa - Number of allocas analyzed for replacement 

2 sroa - Number of allocas promoted to SSA values 

4 sroa - Number of instructions deleted 


上 述 输 出 表明 , mem2reg 和 sroa (聚合 体 的 标量 替换 ) 都 参与 了 删除 多 余 的 
allocas 指令 。 我 们 可 以 单独 运行 sroa 以 了 解 其 工作 流程 : 


$ opt sum-00.11 -stats -sroa -oO sum-01.11 


1 cgscc-passmgr - Maximum CGSCCPassMgr iterations on one SCC 
1 functionattrs - Number of functions marked readnone 

2 mem2reg - Number of alloca's promoted with a single store 
1 reassociate - Number of insts reassociated 

1 sroa -~ Maximum number of partitions Per alloca 

2 sroa - Maximum number of uses of a partition 

4 sroa - Number of alloca partition uses rewritten 
2 sroa - Number of alloca partitions formed 

2 sroa - Number of allocas analyzed for replacement 
2 sroa - Number of allocas promoted to SSA values 

4 sroa - Number of instructions deleted 


注意 ， 即 使 没有 在 命令 行 中 显 式 指 定 ，sroa 也 会 使 用 mem2reg。 如 果 只 激活 mem2reg 
流程 ， 也 会 看 到 相同 的 改进 : 


$ opt sum-00.11 -stats -mem2reg -Oo sum-01.11 


..。Statistics Collected ... 


2 mem2reg - Number of alloca's promoted 
2 mem2reg - Number of alloca's promoted with a single store 


5.5.3 流程 间 的 依赖 关系 
变换 流程 (transform pass) 和 分 析 流 程 (analysis pass) 有 两 种 主要 的 依赖 关系 : 


e 显 式 依赖 : 变换 流程 请 求 分 析 流 程 ， 这 时 ， 流 程 管理 器 会 自动 调度 其 依赖 的 分 析 流 
程 ， 并 让 它 在 变换 流程 之 前 运行 。 如 果 你 尝试 运行 一 个 依赖 于 其 他 流程 的 流程 ， 管 
理 器 会 自动 将 所 有 必要 的 流程 安排 到 它 之 前 运行 。 循 环 信息 ( Loop Info) 和 支配 树 
(Dominator Tree) 是 向 其 他 流程 提供 信息 的 分 析 例 子 。 支 配 树 是 一 种 重要 的 数据 结 
构 ，SSA 构建 算法 利用 它 决 定 在 哪里 放置 phi 函数 。 以 mem2reg 为 例 ， 当 它 在 实 
现 中 请 求 domtree 时 ， 这 两 个 流程 就 建立 了 依赖 关系 : 


DominatorTree &DT = getAnalysis<DominatorTree> (Func); 


e 隐 式 依赖 : 某 些 变换 或 分 析 流程 依赖 于 IR 代码 以 使 用 特定 的 语句 或 者 模式 。 即 使 IR 
只 有 数量 极 大 的 其 他 方式 来 表示 相同 的 计算 ， 通 过 这 种 方式 编译 器 仍然 可 以 进行 快 
速 识别 。 这 种 关系 称 为 隐 式 依赖 。 例 如 ， 某 个 流程 已 经 被 明确 设计 为 在 另 一 个 变换 
流程 之 后 才能 进行 ， 该 流程 可 能 会 偏向 于 遵循 特定 模式 的 代码 (来 自 之 前 的 流程 )。 
在 这 种 情况 下 ， 因 为 这 种 细微 的 依赖 关系 存在 于 变换 流程 而 不 是 分 析 流程 上 ， 所 以 
需要 通过 命令 行 工 具 (clang 或 opt) 或 者 使 用 流程 管理 器 以 正确 的 顺序 手动 将 其 
添加 到 流程 队列 。 如 果 传 人 的 IR 没有 使 用 该 流程 所 能 识别 的 代码 模式 ， 该 流程 将 无 
法 匹配 代码 ， 并 会 静默 地 跳 过 代码 转换 。 给 定 优化 级 别 中 的 流程 集合 已 经 是 独立 的 ， 
不 会 出 现 依赖 问题 。 

可 以 使 用 opt 工具 获取 有 关 流 程 管 理 器 如 何 调度 流程 以 及 正在 使 用 哪些 依赖 流程 的 相 

关 信 息 。 例 如 ， 可 以 使 用 以 下 命令 打印 单独 调用 mem2reg 时 所 使 用 的 流程 的 完整 列表 : 


$ opt sum-00.11 -debug-pass=Structure -mem2reg -S -oo sum-O01.11 


Pass Arguments: -targetlibinfo -datalayout -notti -basictti -x86tti 
-domtree -mem2reg -preverify -verify -print-module 


Target Library Information 

Data Layout 

No target information 

Target independent code generator's TTI 

X86 Target Transform Info 

ModulePass Manager 
FunctionPass Manager 

Dominator Tree Construction 
Promote Memory to Register 
Preliminary module verification 
Module Verifier 


Print module to stderr 
在 Pass Arguments 列表 中 ， 可 以 看 到 流程 管理 器 在 执行 mem2reg 之 前 执行 了 哪些 额 
外 的 流程 。 例 如 ， 流 程 管理 器 自动 执行 了 domtree 流程 。 上 述 输出 还 详细 说 明了 用 于 运行 每 
个 流程 的 结构 : 紧 跟 在 ModulePass 管理 器 之 后 的 流程 作用 于 每 个 模块 ， 而 FunctionPass 
管理 器 下 面 的 流程 作用 于 每 个 函数 。 我 们 还 可 以 看 到 流程 的 执行 顺序 ， 例 如 “Promote 
Memory to Register” 流 程 在 它 的 依赖 项 “ Dominator Tree Construction” 流 程 
之 后 运行 。 
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5.5.4 了 解 流程 API 


Pass 类 是 实现 代码 优化 的 主要 资源 。 但 它 不 能 直接 使 用 ， 而 只 能 通过 知名 的 子 类 来 使 
用 它 。 实 现 流程 时 ， 应 该 选择 能 让 你 的 流程 性 能 最 佳 的 合适 粒度 的 最 佳 子 类 ， 例 如 每 个 函 
数 、 每 个 模块 、 每 个 循环 或 者 每 个 强 连通 的 组 件 等 。 这 种 子 类 的 常见 例子 如 下 : 

e ModulePass : 这 是 最 通用 的 流程 ; 它 作 用 于 整个 模块 ， 没 有 特定 的 函数 顺序 。 它 

允许 模块 内 的 函数 删除 和 其 他 变化 ， 不 为 其 使 用 者 担保 任何 属性 。 通 常 需要 编写 一 
个 从 ModulePass 继承 的 类 ， 并 重 载 runonModule( ) 方法 。 

e FunctionPass : 这 个 子 类 允许 一 次 处 理 一 个 函数 ， 没 有 特定 的 顺序 。 它 是 最 流行 
的 流程 类 型 ， 而 且 它 禁止 改变 外 部 函数 ， 也 不 允许 删除 函数 和 全 局 变量 。 在 使 用 它 
时 ， 需 要 写 一 个 重 载 runonFunction( ) 方法 的 子 类 。 

e BasicBlockPass : 该 子 类 作用 于 每 个 基本 块 。FunctionPass 类 中 禁用 
的 修改 同样 适用 于 此 类 。 它 也 禁止 更 改 或 删除 外 部 基本 块 。 需 要 编写 一 个 从 
BasicBlockPass 继承 的 类 ， 并 重 载 它 的 runonBasicBlock( ) 方法 。 

如 果 被 分 析 的 单元 〈 模 块 、 函 数 和 基本 块 ) 保持 不 变 ， 则 重 载 的 入 口 点 runonModule()、 
runonFunction() 和 runonBasicBlock() 返回 一 个 布尔 值 false， 否则 返回 值 为 
true。 可 以 从 http://llvm.org/docs/WritingAnLLVMPass.html 找到 关于 Pass 
子 类 的 完整 文档 。 


5.5.5 自 定 义 流程 


假设 我 们 需要 计算 程序 中 每 个 函数 的 参数 个 数 ， 并 输出 函数 名 称 。 我 们 可 以 通过 写 一 
个 自 定义 的 编译 流程 来 实现 这 些 功能 。 首 先 ， 我 们 需要 选择 正确 的 Pass 子 类 。 这 个 例子 中 
FunctionPass 较为 合适 的 ， 因 为 我 们 不 依赖 于 函数 顺序 ， 也 不 需要 删除 任何 东西 。 

我 们 命名 流程 为 FnArgcnt 并 将 其 放置 在 LLVM 源 代 码 树 下 : 


$ cd <llvm source tree> 
$ mkdir lib/Transforms/FnArgCnt 
$ cd lib/Transforms/FnArgCnt 


FnArgCnt .cpp 文件 位 于 Lib/Transforms/FnRrgCcnt， 它 需要 包含 流程 实现 ， 代 
人 码 如 下 : 

#include "llvm/IR/Function.h" 

#include "llvm/Pass.h" 


#include "llvm/Support/raw ostream.h" 


using namespace llvm; 


namespace { 
class FnArgCnt : public FunctionPass { 
public: 
static char ID; 
FnArgCnt () : FunctionPass (ID) {} 


virtual bool runonFunction(Function &F) { 


errs() << "FnArgCnt -=-- " 
errs() << F.getName() << ": 
errs() << F. de et < '\n'y 
return false; 
} 
}; 
} 


char FnArgCnt: :ID = 07 
static RegisterPpass<FNnArgCnt> X("fnargcnt", "Function Argument 
Count Pass'", false, false); 


首先 ， 我 们 包含 必要 的 头 文件 并 从 11vm 命名 空间 导入 符号 : 


#include "llvm/IR/Function.h" 
#include "llvm/Pass.h" 
#include "llvm/Support/raw ostream.h" 


using namespace llvm; 


接 下 来 ,我们 声明 FnArgCnt 类 ( FunctionPass 子 类 ), 并 在 runonFunction() 方 
法 中 实现 其 主要 功能 。 我 们 可 以 从 每 个 函数 上 下 文中 打印 函数 名 称 和 它 接 收 的 参数 数量 。 由 
于 该 类 对 所 分 析 的 函数 没有 做 任何 修改 ， 因 此 该 方法 返回 false。 该 子 类 的 代码 如 下 : 


namespace { 
struct FnArgCnt : public FunctionPass { 
static char ID; 
FnArgCnt () : Functionpass (ID) {} 


virtual bool runonFunction(Function &F) { 
errs() << "FnArgCnt --- "; 
errs() << F.getName() << " ; 
errs() << F.getArgumentList() .size() << '\n'; 
return false; 

} 

A 
} 


上 述 代码 中 的 ID 由 LLVM 内 部 确定 ， 以 区 分 不 同 的 流程 ， 它 可 以 用 任何 值 初始 化 : 
char FnArgCnt::ID = 0; 


最 后 ， 我 们 处 理 这 个 流程 的 注册 机 制 ， 下 面 的 代码 在 流程 加 载 时 向 流程 管理 器 注册 刚刚 
写 好 的 流程 。 


static RegisterPass<FnArgCnt> X("fnargcnt", "Function Argument 
Count Pass", false, false); 


第 一 个 参数 fnargcnt 是 流程 名 称 ， 可 以 被 opt 工具 用 于 识别 并 执行 该 流程 ， 而 第 二 
个 参数 对 应 于 该 流程 的 扩展 名 。 第 三 个 参数 表示 该 流程 是 否 改变 了 当前 的 CFG， 最 后 一 个 
参数 只 有 在 它 实 现 了 一 个 分 析 流程 时 才 返 回 true。 

使 用 LLVM 构建 系统 构建 和 运行 自 定义 的 流程 

为 了 编译 和 安装 流程 ， 我 们 需要 在 源 代码 目录 下 新 建 一 个 Makefile。 与 之 前 的 项 目 不 
同 ， 我们 不 再 构建 一 个 独立 的 工具 ， 而 是 将 这 个 Makefile 集成 在 LLVM 构建 系统 中 。 由 于 
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该 子 MakeFile 依赖 于 LLVM 项 目的 主 MakeFile， 而 在 主 MakeFile 中 已 经 定义 了 大 量 的 规 
则 ， 因 此 这 些 规则 不 需要 在 子 MakeFile 中 重复 定义 ， 其 内 容 比 独立 Makefile 简单 得 多 。 请 
参阅 以 下 代码 : 


# Makefile for FnArgCnt pass 


# Path to top level of LLVM hierarchy 
HEVELE = s/s uf 


# Name of the library to build 
LIBRARYNAME = LLVMFNArgCnt 


# Make the shared library become a loadable module so the tools can 
# dlopen/dlsym on the resulting library. 
LOADABLE MODULE = 1 


# Include the makefile implementation stuff 
include $ (LEVEL) /Makefile .common 


Makefile 中 的 注释 非常 详细 ， 并 使 用 LLVM 中 通用 的 Makefile 创建 一 个 共享 库 。 通 过 
这 种 架构 ， 我 们 的 流程 可 以 与 其 他 标准 流程 一 起 安装 ， 并 直接 通过 opt 加 载 ， 但 在 这 之 前 需 
要 重新 构建 LLVM。 

此 外 ,我 们 也 希望 我 们 的 流程 被 编译 到 LLVM 的 对 象 存储 目录 中 ， 因 此 需要 将 我 们 的 
流程 包含 在 Transforms 目录 下 的 Makefile 中 。 在 lib/Transforms/Makefile 中 ， 
需要 改变 PARALLEL _DIRS 变量 以 包含 FnArgCnt 流程 : 


PARALLEL DIRS = Utils Instrumentation Scalar InstCombine IPO 
Vectorize Hello ObjCARC FnArgCnt 


根据 第 1 章 的 说 明 ， 需 要 重新 配置 LLVM 项 目 : 
$ cd path-to-build-dir 
$ /PATH TO SOURCE/configure --prefix=/your/installation/folder 


现在 ， 从 对 象 目录 进入 新 的 流程 目录 并 运行 make: 


$ cd lib/Transforms/FnArgCnt 


$ make 


共享 库 将 放置 在 目录 Depug+Asserts/1ib 中 的 构建 树 下 。 用 户 需 要 将 Debug+RAsserts 
替换 为 自己 所 需 的 配置 模式 ， 例 如 ， 如 果 是 最 后 的 发 布 版 本 ， 则 替换 为 Release。 现 在 ， 我 
们 可 以 调用 opt 执行 自 定义 好 的 流程 (以 Mac OS X 系统 为 例 ): 


$ opt -load <path to build dir>/Debug+Asserts/lib/LLVMFNArgCnt .dylib 
-fnargcnt < sum.bc >/dev/null 


FnArgCnt --- sum: 2 

在 Linux 系统 中 ,我 们 需要 使 用 适当 的 共享 库 扩展 名 ( .so0)。 上 述 输出 显示 sum.bc 模 
块 只 有 一 个 带 有 两 个 整数 参数 的 函数 ,符合 我 们 的 预期 。 

另外 一 种 方式 是 重新 构建 整个 LLVM 系统 并 重新 安装 它 。 这 将 安装 一 个 新 的 opt 可 执行 


文件 ， 它 无 须 额 外 的 -load 命令 行 参数 就 能 识别 我 们 的 自 定义 流程 。 

使 用 自己 的 Makefile 构建 和 运行 新 流程 

对 LLVM 构建 系统 的 依赖 让 人 烦恼 ， 比 如 需要 重新 配置 整个 LLVM 项 目 , 或 重新 构 
建 所 有 LLVM 工具 。 本 小 节 介 绍 如 何 通过 创建 一 个 独立 的 Makefile 文件 来 避免 这 些 烦琐 的 
工作 。 该 Makefile 可 以 像 之 前 构建 项 目 一 样 编译 LLVM 源 代 码 树 之 外 的 流程 。 建 立 自己 的 
Makefile 需要 额外 的 工作 ， 但 是 这 使 得 我 们 的 代码 能 够 独立 于 LLVM 源 代 码 树 。 

这 里 将 要 介绍 的 Makefile 建立 于 在 第 3 章 中 用 于 构建 示例 工具 的 独立 Makefile 基础 之 
上 。 与 其 不 同 之 处 在 于 我 们 不 再 构建 一 个 工具 ， 而 是 一 个 基于 流程 的 代码 ， 并 可 以 通过 opt 
工具 按 需 加 载 的 共享 库 。 

我 们 首先 为 该 项 目 创建 一 个 不 在 LLVM 源 代码 树 内 的 单独 文件 夹 。 我 们 把 包含 有 流程 
实现 代码 的 FnArgCcnt .cpp 文件 放 在 这 个 文件 夹 中 。 其 次 ， 我 们 创建 如 下 Makefile: 


LLVM CONFIG?=llvm-config 


ifndef VERBOSE 
QUIET:=@ 
endif 


SRC DIR?=$ (PWD) 

LDFLAGS+=$ (shell $(LLVM CONFIG) --ldflags) 

COMMON FLAGS=-Wall -Wextra 

CXXFLAGS+=$ (COMMON_ FLAGS) $ (shell $ (LLVM CONFIG) --cxxflags) 
CPPFLAGS+=$ (shell $ (LLVM CONFIG) --cppflags) -I$ (SRC DIR) 


ifeq ($(shell uname) ,Darwin) 
LOADABLE MODULE OPTIONS=-bundle -undefined dynamic lookup 
else 

LOADABLE MODULE OPTIONS=-shared -Wl,-01 

endif 


FNARGPASS=fnarg.so 
FNARGPASS OBJECTS=FNnArgCnt.o 
default: $ (FNARGPASS) 


%.0 : $(SRC DIR)/%.cpp 
@echo Compiling $*.cpp 
$ (QUIET)S$ (CXX) -c $ (CPPFLAGS) $ (CXXFLAGS) $< 


$ (FNARGPASS) : $ (FNARGPASS OBJECTS) 

@echo Linking $@ 

$ (QUIET) $ (CXX) -o $@ $ (LOADABLE MODULE OPTIONS) $ (CXXFLAGS) 
$ (LDFLAGS) 8$^ 
clean:: 

$ (QUIET)rm -f $ (FNARGPASS) $ (FNARGPASS OBJECTS) 


与 第 3 章 中 的 示例 Makefile 相 比 ， 上 述 Makefile 中 的 不 同 之 处 (加 粗 部 分 ) 在 于 
LOADABLE_MODULE_OPTIONS 变量 的 条 件 定义 ， 该 变量 在 链接 我 们 的 共享 库 的 命令 行 中 
使 用 。 它 定义 了 一 组 和 平台 相关 的 编译 器 标志 ， 以 指示 编译 器 输出 一 个 共享 库 ， 而 不 是 一 个 
可 执行 文件 。 例 如 ， 对 于 Linux， 它 使 用 -shared 标志 来 创建 共享 库 ， 同 时 使 用 -Wl1, -01 
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标志 ， 后 面 这 组 标志 将 -01 标志 传递 给 GNU 链接 器 ld 命令， 要求 GNU 链接 器 执行 符号 表 
优化 ， 从 而 减少 库 加 载 时 间 。 如 果 不 使 用 GNU 链接 器 ， 可 以 省 略 该 标志 。 

我 们 还 从 链接 器 命令 行 中 删除 了 11lvm-config --1Libs 的 shell 命令 。 这 个 命令 被 用 
来 提供 我 们 的 项 目 要 链接 的 库 。 我 们 已 经 确定 opt 工具 已 经 具有 所 有 必需 的 符号 ， 因 此 可 
以 省 去 该 命令 ， 以 缩短 链接 时 间 。 

接 下 来 我 们 使 用 以 下 命令 行 构建 该 项 目 : 


$ make 


使 用 以 下 命令 行 运行 在 fnarg.so 中 构建 好 的 流程 : 
$ opt -load=fnarg.so -fnargcnt < sum.bc > /dev/null 


FnArgCnt --- sum: 2 


5.6 总 结 


LLVM IR 是 前 端 和 后 端 之 间 的 连接 点 ， 也 是 进行 独立 于 编译 目标 的 代码 优化 的 地 方 。 
在 本 章 中 ,我 们 探讨 了 用 于 操作 LLVM IR 的 工具 、IR 语法 以 及 如 何 编 写 自 定义 IR 代码 生 
成 器 。 此 外 ， 我们 展示 了 编译 流程 的 接口 如 何 工 作 ， 以 及 如 何 应 用 优化 ， 然 后 提供 了 如 何 编 
写 自己 的 IR 变换 或 分 析 流 程 的 示例 。 

在 下 一 章 中 ， 我 们 将 讨论 LLVM 后 端 如 何 工作 ， 以 及 如 何 构建 一 个 能 够 将 LLVM IR 代 
码 编译 为 指定 架构 的 后 端 。 
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LLVM 后 端 由 一 组 代码 生成 分 析 器 和 变换 流程 (pass) 组 成 ， 这 些 流程 将 LLVM 中 间 
表示 (IR) 转换 为 目标 代码 (或 汇编 代码 )。LLVM 支持 多 种 目标 平台 : ARM、AArch64、 
Hexagon、MSP430、MIPS、Nvidia PTX、PowerPC、R600、SPARC、SystemZ、X86 和 
XCore。 所 有 这 些 平台 的 后 端 共享 一 个 通用 接口 ， 该 接口 使 用 通用 API 抽象 出 后 端 任务 ， 是 
独立 于 目标 平台 的 代码 生成 器 的 组 成 部 分 。 每 个 目标 平台 都 要 在 代码 生成 器 通用 类 的 基础 上 
进行 特 化 ， 以 实现 该 目标 平台 所 需 的 所 有 功能 。 在 本 章 中 ， 我 们 将 介绍 许多 LLVM 后 端的 
通用 部 分 的 内 容 ， 这 些 知识 对 有 兴趣 开发 新 后 端 、 维 护 现 有 后 端 或 编写 后 端 流程 的 读者 非常 
有 用 。 本 章 将 涵盖 以 下 主题 : 

e LLVM 后 端 组 织 结构 的 概述 

e 如 何 解释 描述 后 端的 各 种 TableGen 文件 

e LLVM 中 的 指令 选择 

e 指令 调度 和 寄存 器 分 配 

e 代码 输出 

e 如 何 自 定义 后 端 编译 流程 


6.1 概述 


将 LLVM IR 转换 成 目标 汇编 代码 涉及 几 个 步骤 。IR 首先 被 转换 为 包含 指令 、 函 数 和 全 
局 变量 的 对 后 端 友 好 的 表示 形式 ， 该 表示 形式 随 着 程序 在 编译 器 后 端的 处 理 进展 而 变化 ， 并 
逐步 接近 最 终 的 目标 指令 。 图 6-1 显示 简化 的 从 LLVM IR 到 目标 代码 或 汇编 代码 的 必要 步 
又 ， 其 中 的 白 框 代表 可 以 进一步 提高 编译 质量 的 额外 的 优化 流程 。 





图 6-1 


这 个 编译 流程 由 以 浅 灰 色 框 表 示 的 不 同 后 端 阶段 组 成 ， 它 们 也 被 称 为 超级 流程 ， 因 为 其 
内 部 都 包含 几 个 较 小 的 流程 。 图 6-1 中 灰色 框 与 白色 框 的 区 别 在 于 ， 前 者 表示 一 组 对 后 端 纺 
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译 至 关 重 要 的 流程 ， 而 后 者 表示 对 提高 所 生成 代码 的 效率 更 重要 的 优化 流程 。 下 面 列 出 图 中 
所 列 代码 生成 器 的 不 同 阶段 的 简单 描述 : 

e 指令 选择 阶段 将 内 存 中 的 IR 表示 转换 为 指定 目标 的 SelectionDAG 节点 。 该 阶段 
一 开始 将 LLVM IR 的 三 地 址 结构 转换 为 有 向 无 环 图 ( DAG ) 形式 。 每 个 DAG 图 对 
应 一 个 基本 块 内 的 指令 ， 即 每 个 基本 块 都 与 一 个 不 同 的 DAG 图 相关 联 。DAG 图 中 
的 节点 通常 表示 指令 ， 而 边 则 表示 指令 之 间 存 在 数据 流 依赖 关系 ， 但 不 仅 限 于 此 。 
基于 DAG 图 的 转换 是 后 端 中 的 重要 环节 ， 以 便 人 允许 LLVM 代码 生成 器 库 利 用 基于 模 
式 匹配 的 指令 选择 算法 ， 此 算法 经 过 修改 也 作用 于 DAG (不 仅 是 树 )。 到 此 阶段 结束 
为 止 ， DAG 图 中 所 有 LLVM IR 节点 都 会 转换 为 目标 机 器 节点 ， 即 每 个 节点 代表 目标 
机 器 指令 ， 而 不 是 LLVM 指令 。 
在 完成 指令 选择 之 后 ， 编 译 器 已 经 清楚 应 该 使 用 哪些 目标 指令 来 执行 每 个 基本 块 的 
计算 ， 这 些 信息 包含 在 SelectionDAG 类 中 。 但 DAG 图 并 不 包含 没有 相互 依赖 
关系 的 指令 间 的 顺序 ， 所 以 还 需要 返回 三 地 址 指令 形式 ， 以 确定 基本 块 内 的 指令 顺 
序 。 指 令 调 度 ( Instruction Scheduling ) 也 称 为 前 寄存 器 分 配 调度 ( Pre-registeter 
Allocation Scheduling)， 它 的 第 一 个 实例 负责 在 尽 可 能 多 地 优化 指令 级 并 行 度 的 同 
时 对 指令 进行 排序 。 所 有 指令 接 下 来 将 被 转换 为 MachineInstr 三 地 址 表示 形式 。 
在 之 前 的 章节 中 介绍 过 ，LLVM IR 有 一 组 无 限 寄 存 器 。 这 个 特性 将 一 直 持续 到 寄存 
器 分 配 ( Register Allocation ) 阶段 之 前 ， 该 阶段 将 无 限 虚 拟 寄 存 器 集 引 用 转换 成 特 
定 于 目标 的 有 限 寄存 器 集 ， 在 需要 时 产生 溢出 (spill) 。 
随后 编译 器 运行 指令 调度 的 第 二 个 实例 ， 称 为 后 寄存 器 分 配 调度 ( Post-register 
Allocation Scheduling)。 由 于 此 时 目标 机 器 的 寄存 器 信息 已 经 可 用 ， 编 译 器 可 以 根 
据 硬 件 资源 的 竞争 关系 和 不 同 寄存 器 的 访问 延迟 差异 性 进一步 提升 生成 的 代码 质量 。 

e 最 后 是 代码 输出 ( Code Emission) 阶段 ， 它 负责 将 MachineInstr 表示 的 指令 转 

换 为 McCInst 实例 。 这 种 新 的 表示 形式 更 适 于 汇编 器 和 链接 器 ， 通 常 有 两 种 选择 : 
输出 汇编 代码 或 者 将 二 进 制 大 对 象 输出 为 特定 的 目标 代码 格式 。 

通过 上 述 简要 说 明 ， 可 以 观察 到 LLVM 在 整个 后 端 流程 中 使 用 了 四 种 不 同 层次 的 指令 

表示 形式 :内 存 中 的 LLVM IR、SelectionDAG 节点 、MachineInstr 和 MCInst。 


使 用 后 端 工 具 


llc 是 LLVM 后 端的 主要 工具 。 在 上 一 章 中 的 sum.bc 位 码 的 基础 上 ， 我 们 可 以 用 下 
面 的 命令 生成 汇编 代码 : 


$ llc sum.bc -o sum.s 


或 者 ,为 了 生成 目标 代码 ,我们 使 用 下 面 的 命令 : 


$ llc sum.bc -filetype=obj -o sum.o 


使 用 上 述 命 会 使 11c 选择 一 个 与 sum.bc 位 码 中 指定 的 目标 三 元 组 相 匹配 的 后 端 。 我 
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们 也 可 以 使 用 -march 选项 覆盖 并 指定 特定 的 后 端 。 例 如 ， 使 用 以 下 命令 来 生成 MIPS 目标 
代码 : 


$ llc -march=mips -filetype=obj sum.bc -o sum.o 


如 果 使 用 11c -version 命令 ,11c 将 显示 -march 支持 的 选项 的 完整 列表 。 请 注意 ， 
此 列表 与 在 LLVM 配置 期 间 使 用 的 --enable-targets 选项 兼容 (有 关 详 细 信 息 ， 请 参 
阅 第 1 章 )。 

但 要 注意 的 是 ， 我 们 刚才 强制 11c 使 用 不 同 的 后 端 来 为 最 初 为 x86 编译 的 位 码 生 成 代 
码 。 在 第 5 章 中 ,我 们 解释 了 尽管 IR 被 设计 成 所 有 后 端的 通用 语言 ， 但 仍然 具有 一 定 的 目标 
依赖 问题 。 原 因 是 C/C++ 语言 具有 目标 依赖 的 属性 ， 所 以 这 种 依赖 性 也 反映 在 LLVM IR 上 。 

因此 ， 在 位 码 目标 三 元 组 与 -march 目标 不 匹配 时 ， 必 须 小 心 使 用 11c。 这 种 情况 可 
能 会 导致 ABI 不 匹配 和 生成 代码 质量 较 低 等 问题 ， 并 在 某 些 情况 下 会 导致 代码 生成 器 失败 。 
在 大 多 数 情况 下 ， 代 码 生成 器 不 会 失败 ， 只 是 会 生成 带 有 细小 错误 的 代码 ， 而 这 更 为 糟糕 。 


为 了 理解 IR 目标 依赖 在 实际 场景 中 是 怎样 出 现 的 ， 我 们 来 看 一 个 例子 。 假 设 有 
这 样 一 个 场景 ; 一 个 程序 分 配 了 一 个 char 指针 向 量 来 存储 不 同 的 字符 串 ， 它 使 
用 C 语言 函数 malloc(sizeof(charx )x*n) 来 为 该 字符 串 向 量 分 配 内 存 。 如 
果 指 定 的 前 端 目标 是 一 个 32 位 MIPS 架构 ， 则 会 生成 一 个 位 码 ， 要 求 malloc 
分 配 n 个 4 字 节 的 内 存 ， 因 为 32 位 MIPS 中 的 每 个 指针 都 是 4 字 节 。 但 是 ， 如 
果 使 用 此 位 码 作为 11c 的 输入 ， 并 强制 它 在 x86 64 体系 结构 上 编译 ， 则 会 生成 
不 完整 程序 。 在 运行 时 ， 会 发 生 潜在 的 分 段 错误 ， 因 为 x86_64 的 每 个 指针 均 使 
用 8 个 字 节 ， 显 然 我 们 的 malloc 调用 规模 过 小 。 针 对 x86 64 的 正确 malloc 
调用 将 分 配 n 科 以 8 字 节 的 空间 。 


6.2 后 端 代码 结构 介绍 


后 端 实现 分 散在 LLVM 源 代码 树 的 不 同 目录 中 。 代 码 生成 的 主要 库 在 1ib 目录 及 其 子 

文件 夹 CodeGen、MC、TableGen 和 Target 中 : 

e CodeGen 目录 包含 所 有 通用 代码 生成 算法 的 实现 文件 和 头 文件 : 指令 选择 、 指 令 调 
度 、 寄 存 器 分 配 以 及 它们 所 需 的 辅助 分 析 函 数 。 

e MC 目录 包含 汇编 器 〈 汇 编 语言 分 析 程 序 )、 松 弛 算法 〈 反 汇编 器 ) 和 具体 的 对 象 文件 
(如 ELF、COFF、Macho0 等 ) 等 低层 功能 的 实现 。 

e TableGen 目录 包含 TableGen 工具 的 完整 实现 ,该 工具 用 于 根据 .td 文件 中 的 高 
层 目标 描述 来 生成 C++ 代码 。 

e 每 个 目标 都 在 Target 文件 夹 (例如 Target/Mips) 下 的 不 同 子 文件 夹 中 实现 ， 通 
常 包含 多 个 .cpp，.h 和 .td 文件 。 在 不 同 目标 中 实现 类 似 功能 的 文件 通常 共享 相 
似 的 名 称 。 

如 果 你 编写 了 一 个 新 的 后 端 ， 你 的 代码 将 仅 存 在 于 Target 文件 夹 的 子 文件 夹 中 。 举 
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个 例子 〈 参 见 表 6-1 )， 我 们 使 用 Sparc 来 说 明 Target/sparc 子 文件 夹 的 组 织 结构 : 
表 6-1 Target/Sparc 子 文 件 夹 的 组 织 结构 


文件 名 描述 
SparcIinstrIinfo.td 指令 和 格式 定义 寄存 器 和 寄存 器 类 定义 
SparcIinstrFormats.td 
SparcRegisterInfo.td 指令 和 格式 定义 寄存 器 和 寄存 器 类 定义 
SparcISelDRGToDRG .cpp 指令 选择 
SparcISelLowering.cpp SelectionDRG 节点 降低 
SparcTargetMachine .cpP 关于 特定 于 目标 的 属性 (如 数据 分 布 和 ABI) 的 信息 
Sparc.td 定义 机 器 特征 、CPU 变 体 和 扩展 特征 
SparcRsmPrinter .cpp 汇编 代码 输出 
SparcCallingCconv .td ABI 定 义 的 调用 约定 


由 于 后 端 通常 遵守 该 代码 组 织 结构 ， 开 发 人 员 可 以 通过 这 种 映射 关系 找到 解决 方案 ， 
比如 很 容易 查看 后 端的 某 个 特定 问题 是 如 何在 另 一 个 目标 中 实现 的 。 例 如 ， 如 果 你 正在 
SparcRegisterInfo.td 中 编写 Sparc 后 端 寄存 器 信息 ， 并 且 想 知道 x86 后 端 如 何 实现 
这 一 点 ， 那 么 只 需 查 看 Target /X86 文件 夹 中 的 X86RegisterInfo.td 文件 。 


6.3 ”后 端 库 介绍 


11c 非 共 享 代码 非常 少 (参见 tools/11lc/1l1lc.cpp), 与 其 他 LLVM 工具 一 样 ， 其 
大 部 分 功能 都 以 可 重用 库 的 形式 实现 。11c 的 功能 由 代码 生成 器 库 提供 。 这 套 代码 库 由 目标 
相关 部 分 和 目标 无 关 部 分 组 成 ， 这 两 个 部 分 对 应 的 库 在 不 同 的 文件 中 ， 方便 开发 者 选择 想 链 
接 的 部 分 。 例 如 ， 如 果 在 LLVM 配置 期 间 使 用 --enable-targets=x86,arm 命令 ， 则 
只 有 x86 和 ARM 后 端 库 链接 到 11c。 

回想 一 下 ， 所 有 LLVM 库 都 以 1ibLLVM 作为 前 级 。 为 了 描述 清晰 ， 这 里 我 们 省 略 了 此 
前 缀 。 目 标 无 关 的 代码 生成 器 库 包 括 : 

e RsmParser.a: 该 库 包 含 解析 汇编 文本 和 实现 汇编 程序 的 代码 。 

e RsmPrinter.a: 该 库 包 含 打 印 汇编 语言 和 实现 能 生成 汇编 文件 的 后 端的 代码 。 

e CodeGen .a: 该 库 包 含 代码 生成 算法 。 
MC.a: 该 库 包含 MCInst 类 及 其 相关 代码 ， 用 于 表示 LLVM 允许 的 最 低层 次 程序 。 
MCDisassembler .a : 该 库 包含 用 于 实现 反 汇编 器 的 代码 ， 该 反 汇 编 器 用 于 读 取 目 
标 代码 并 将 其 解码 为 MCInst 对 象 。 
MCJIT.a: 该 库 包 含 即 时 代码 生成 器 的 实现 。 
MCParser.a : 该 库 包 含 MCAsmParsezr 类 的 接口 ， 用 于 实现 一 个 组 件 ， 以 解析 汇 
编 文 本 并 执行 汇编 器 的 部 分 工作 。 
SelectionDAG .a: 该 库 包 含 SelectionDAG 和 相关 类 。 
Target .a: 该 库 包含 的 接口 允许 目标 无 关 函 数 请 求 目标 相关 函数 ， 尽 管 这 个 函数 本 
身 是 在 其 他 〈 目 标 相 关 ) 库 中 实现 的 。 


另 一 方面 ， 目 标 相 关 的 库 如 下 : 
e <Target> AsmParser.a: 该 库 包 含 AsmParser 库 的 目标 相关 部 分 ， 负 责 实 现 针 
对 目标 机 器 的 汇编 右 。 
<Target> RsmPrinter.a: 该 库 包含 打印 目标 指令 的 函数 ， 被 后 端 用 于 生成 汇编 
关 件 。 
<Target> CodeGen .a : 该 库 包 含 后 端的 大 部 分 与 目标 相关 的 功能 ， 包 括 特定 的 寄 
存 器 处 理 规则 、 指 令 选 择 和 调度 。 
<Target> Desc.a : 该 库 包含 关于 低级 MC 基础 结构 的 目标 机 器 信息 ， 并 负责 注册 
诸如 MCCodeEmitter 这 样 与 目标 相关 的 MC 对 象 。 
<Target> Disassembler .a : 该 库 为 MCDisassembler 库 补 充 目标 相关 功能 ， 
以 便 使 构建 的 系统 能 够 读 取 字 节 文 件 并 将 其 解码 为 MCInst 目标 指令 。 
<Target> Info.a : 该 库 负责 在 LLVM 目标 代码 生成 器 系统 中 注册 目标 ， 并 提供 
所 谓 的 fasade 类 ， 这 些 类 允许 目标 无 关 的 代码 生成 器 库 访问 目标 相关 的 功能 。 

在 这 些 库 名 称 中 ， 需 要 将 <Target> 替换 为 目标 名 称 ， 例 如 ，X86RAsmParser.a 是 
X86 后 端的 解析 器 库 的 名 称 。 完 整 的 LLVM 安装 过 程 将 在 <LLVM_INSTRLL_PRATH>/1ib 
目录 中 包含 这 些 库 。 


6.4 如 何 使 用 TableGen 实现 LLVM 后 端 


LLVM 使 用 面向 记录 的 语言 TableGen 来 描述 在 若干 个 编译 阶段 使 用 的 信息 。 例 如 ， 在 
第 4 章 中 ,我 们 简要 地 讨论 了 如 何 使 用 TableGen 文件 ( 带 有 .td 扩展 名 ) 来 描述 前 端的 不 同 
诊断 过 程 。TableGen 最 初 由 LLVM 团队 编写 ， 用 来 帮助 程序 员 编 写 LLVM 后 端 。 即 使 代码 
生成 器 库 的 设计 强调 不 同 编译 目标 之 间 的 清晰 分 离 (例如 ,使 用 不 同 的 类 来 反映 寄存 器 信息 
和 指令 )， 然 而 最 终 后 端 程序 员 还 是 会 在 不 同 的 文件 中 编写 使 用 相同 目标 机 器 信息 的 代码 。 
这 种 方法 的 问题 在 于 ， 尽 管 程序 员 在 编写 后 端 代码 时 付出 了 更 多 努力 ， 代 码 中 还 是 会 出 现 必 
须 手 动 同 步 的 元 余 信 息 。 

例如 ， 如 果 你 想 要 更 改 后 端 处 理 寄存 器 的 方法 ， 则 需要 更 改 几 个 不 同 部 分 的 代码 : 更 改 
寄存 器 分 配器 以 显示 寄存 器 支持 哪些 类 型 ， 更改 汇编 器 打印 机 以 反映 如 何 打印 寄存 器 ; 更 改 
汇编 器 解析 器 以 反映 如 何在 汇编 语言 代码 中 执行 解析 ; 更 改 反 汇编 器 ， 因 为 需要 知道 寄存 器 
如 何 编码 。 因 此 ， 后 端的 代码 维护 变 得 复杂 。 

TableGen 是 作为 上 述 问题 的 解决 方案 而 创建 的 ， 它 是 一 种 声明 性 编程 语言 ， 用 于 描述 
充当 目标 信息 核心 存储 库 的 文件 。 它 的 主要 目的 是 想 在 一 个 单独 的 位 置 声 明 目 标 机 器 相关 信 
息 (例如 ,在 <Target>InstrInfo.td 中 存储 关于 机 器 指令 的 描述 信息 )， 然 后 使 用 一 
TableGen 后 端 利 用 该 描述 信息 完成 某 些 特定 功能 ， 比 如 生成 给 予 模式 匹配 的 指令 选择 算法 ， 
因为 用 户 自 行 实现 该 算法 是 一 个 异常 烦琐 的 过 程 。 

现在 TableGen 被 广泛 用 于 描述 目标 机 器 的 各 种 信息 ， 包 括 指令 格式 、 指 令 、 寄 存 器 、 
模式 匹配 DAG 图 、 指 令 选 择 匹配 顺序 、 调 用 惯例 和 目标 CPU 属性 ( 受 支 持 的 指令 集 架构 


(ISA) 特性 和 处 理 器 系列 ) 等 。 


es 模拟 器 和 硬件 综合 描述 文件 一 直 是 计算 机 体 

系 结构 领域 学 者 们 追求 的 目标 ， 目 前 仍然 是 一 个 开放 的 问题 。 典 型 的 方法 是 将 
所 有 的 机 器 信息 放 入 类 似 于 TableGen 的 声明 性 描述 语言 中 ， 然 后 使 用 工具 来 得 
到 用 于 评估 和 测试 处 理 器 架构 所 需 的 各 种 软件 (和 硬件 )。 显 而 易 见 ， 这 项 工作 
非常 具有 挑战 性 ， 生 成 的 工具 质量 仍 稍 逊 于 开发 者 实现 的 版 本 。LLVM 中 使 用 
TableGen 的 目的 是 要 帮助 程序 员 实 现 较 小 的 代码 编码 工作 量 ， 但 仍然 把 用 C++ 
代码 实现 任何 定制 逻辑 的 控制 权 完 全 交 给 程序 员 。 


6.4.1 TableGen 语言 


TableGen 语言 由 用 于 生成 记录 的 定义 和 类 组 成 。 定 义 语句 def 用 于 实例 化 来 自 关键 字 
class 和 multiclass 的 记录 。 这 些 记 录 由 TableGen 后 端 进一步 处 理 ， 以 便 为 代码 生成 
器 、Clang 诊断 过 程 、Clang 驱动 程序 选项 和 静态 分 析 器 检查 程序 等 生成 特定 的 信息 。 因 此 ， 
记录 仅 用 于 存储 信息 ， 其 实际 含义 由 后 端 决定 。 

我 们 通过 一 个 简单 的 例子 来 说 明 TableGen 是 如 何 工 作 的 。 假 设 你 想 为 某 个 处 理 器 架构 
定义 ADD 和 SUB 指令 ， 其 中 ADD 有 以 下 两 种 形式 : 一 种 是 所 有 操作 数 都 是 寄存 器 ， 另 外 一 
种 是 操作 数 是 寄存 器 和 立即 数 。 

而 SUB 指令 只 有 第 一 种 形式 。 请 参阅 insns .td 文件 中 的 以 下 示例 代码 : 


class Insn<bits <4> MajOpc, bit MinOpc> { 
bits<32> insnEncoding; 
let insnEncoding{15-12} = MajOpc; 
let insnEncoding{11} = MinOpc; 


} 


multiclass RegAndIimmInsn<bits <4> opcode> { 
def rr : Insn<opcode, 0>; 
def ri : Insn<opcode, 1>; 


} 


def SUB : Insn<0x00, 0>; 
defm ADD : RegAndIimmInsn<0x01>; 


Insn 类 表示 常规 指令 ，RegAndImmInsn 多 类 表示 具有 上 述 形式 的 指令 。def SUB 
构造 语句 用 于 定义 SUB 记录 ,而 defm ADD 构 造 语句 用 于 定义 两 个 记录 : ADDrr 和 
ADDri。 通 过 使 用 11l1vm-tblgen 工具 ， 可 以 处 理 .td 文件 并 检查 生成 的 记录 : 


$ llvm-tblgen -print-records insns.td 
~------------ Classes ----------------- 
class Insn<bits<4> Insn:MajOpc = { ?, ?, ?, ? }, bit Insn:MinOpc = ?> { 


bits<5> insnEncoding = { Insn:MinOpc, Insn:MajOopc{0}, 
Insn:MaijOpc{1}, Insn:MajOpc{2}, Insn:MajOopc{3} }; 


string NAME = ?; 
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def ADDri { // Insn ri 
bits<5> insnEncoding = { 1, 1, 0, 0, 0 }; 
string NAME = "ADD"; 
} 
def ADDrr { // Insn rr 
bits<5> insnEncoding = { 0, 1, 0, 0, 0 }; 
string NAME = "ADD"; 
} 
def SUB { // Insn 
bits<5> insnEncoding = { 0, 0, 0, 0, 0 }; 
string NAME = ?; 
} 
也 可 以 在 11vm-tblgen 工具 中 使 用 TableGen 后 端 ， 通过 输入 llvm-tblgen --help 
可 以 列 出 所 有 的 后 端 选项 。 请 注意 ， 我 们 的 示例 未 使 用 特定 于 LLVM 的 领域 ， 无 法 用 于 某 
个 特定 的 后 端 。 有 关 TableGen 语言 方面 的 更 多 信息 ， 请 参阅 http://1llvm.org/docs/ 
TablLleGenFEundamentalLs .htmlo。 


6.4.2 ”代码 生成 器 .td 文件 介绍 


如 前 所 述 ， 代 码 生成 器 广泛 使 用 TableGen 记录 来 表示 特定 于 目标 的 信息 。 我 们 在 本 小 
节 中 介绍 用 于 代码 生成 的 TableGen 文件 。 

6.4.2.1 Target 属性 

<Target>.td 文 件 (例如 ，x86.td) 定义 后 端 所 支持 的 ISA 功能 和 处 理 器 系列 。 例 
如 ，X86.td 定 义 AVX2 扩展 : 


def FeatureAVX2 : SubtargetFeature<"avx2", "X86SSELevel", "AVX2", 
"Enable AVX2 instructions", 
[FeatureAVX] >; 


def 关键 字 基 于 记录 类 类 型 subtargetFeature 定义 记录 FeatureAVX2。 最 后 一 
个 参数 是 已 经 在 该 文件 中 定义 过 的 其 他 扩展 功能 的 列表 。 因 此 ， 具 有 AVX2 扩展 功能 的 处 理 
器 包含 所 有 的 AVX (上 一 代 ) 指令 。 

此 外 ， 我 们 还 可 以 定义 处 理 器 的 类 型 ， 并 包含 它 提供 的 ISA 扩展 或 功能 : 


def : ProcessorModel<"corei7-avx", SandyBridgeMode!l, 
[FeatureAVX, FeatureCMPXCHG16B, ..., 
FeaturePCLMUL] >; 


<Target>.td 文件 还 可 以 包括 所 有 其 他 .td 文件 ， 并 且 作 为 记录 特定 目标 信息 的 主 
要 文件 。11vm-tblgen 工具 必 始 终 使 用 它 来 获取 目标 机 器 的 TableGen 记录 。 例 如 ， 使 
用 以 下 命令 可 以 输出 x86 的 所 有 记录 : 

$ cd <llvm source>/lib/Target/xX86 


$ llvm-tblgen -print-records X86.td -I ../../../include 


xX86 .td 文件 包含 但 不 限于 TableGen 用 于 生成 X86GensubtargetInfo.inc 文 件 
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的 部 分 信息 ， 通 常 在 一 个 .td 文件 和 一 个 单独 的 .in 文件 之 间 没 有 直接 的 映射 关系 。 要 
理解 这 一 点 ， 需 要 明白 <Target>.td 是 一 个 重要 的 最 高 层次 文件 ， 它 通过 TableGen 的 
include 指令 引入 其 他 所 有 文件 。 因 此 在 生成 C++ 代码 时 ，TableGen 总 是 会 解析 所 有 后 
端 .td 文件 ， 这 使 得 你 可 以 根据 需要 将 记录 随意 放 在 任何 合适 的 位 置 。 因 此 即使 X86 .td 
引入 所 有 其 他 后 端 .td 文件， 该 文件 的 内 容 (不 包括 include 指令 ) 也 会 与 Subtarget 
x86 子 类 的 定义 保持 一 致 。 

如 果 查 看 实现 x86Subtarget 类 的 x86Subtarget.cpp 文 件 ， 就 会 发 现 一 条 
#include "X86GensSubtargetInfo.inc" 的 C++ 预 处 理 器 指令 ， 这 是 将 TableGen 生 
成 的 C++ 代码 嵌 和 人 常规 代码 库 中 的 方法 。 这 个 特定 的 include 文件 包含 处 理 器 特征 常量 、 
描述 处 理 器 特征 的 字符 串 以 及 其 他 相关 资源 。 

6.4.2.2 ”寄存 器 

寄存 器 和 寄存 器 类 被 定义 于 <Target> RegisterInfo.td 文 件 中 。 在 稍 后 
定义 指令 时 ， 寄 存 器 类 被 用 于 将 指令 的 操作 数 与 特定 的 寄存 器 组 关联 起 来 。 例 如 ， 
X86RegisterInfo.td 中 定义 了 16 位 寄存 器 ， 其 常用 方式 如 下 : 


let SubRegIndices = [sub 8bit, sub 8bit hi], ... in { 
def AX : X86Reg<"ax", 0, [AL,AH] >; 
def DX : X86Reg<"dx", 2, [DL,DH] >; 
def CX : X86Reg<"cx", 1, [CI CH] 35; 
def BX : X86Reg<"bx", 3, [BL,BH] >; 


let 结构 用 于 定义 一 个 额外 的 字段 (在 上 述 例 子 中 是 SubRegIndices )， 该 字段 被 放 
和 置 在 以 “{” 开 始 和 以 “}” 结 尾 的 环境 所 包含 的 所 有 记录 中 。 从 X86Reg 类 派生 出 的 16 位 
寄存 器 的 定义 用 于 存放 每 个 寄存 器 的 名 称 / 编号 和 一 个 8 位 子 寄存 器 列表 。16 位 寄存 器 的 寄 
存 器 类 定义 的 代码 如 下 : 


def GR16 : RegisterClass<"X86", [i16] ，16， 
(add RN CX DR snar BR; Bh SE 
R8W, RW, ..., R15SW, R12W, R13W)>; 


GR16 寄存 器 类 包含 所 有 16 位 寄存 器 及 其 各 自 寄存 器 的 首选 分 配 顺 序 。 每 个 寄存 器 
类 名 在 TableGen 处 理 后 需要 加 上 后 缀 Regclass， 例 如 GR16 成 为 GR16RegClass。 
TableGen 会 生成 寄存 器 和 寄存 器 类 定义 、 用 于 获取 其 相关 信息 的 函数 实现 、 汇 编 器 所 需 的 
二 进 制 编码 以 及 它们 的 DWARF (Linux 调试 记录 格式 ) 信息 。 可 以 使 用 11vm-tblgen 检 
查 TableGen 生成 的 代码 : 

$ cd <llvm source>/lib/Target/xX86 

$ llvm-tblgen -gen-register-info X86.td -I ../../../include 

另外， 也 可 以 检查 在 LLVM 构建 过 程 中 生成 的 C++ 文件 <LLVM_BUILD_DIR>/Lib/ 
Target/X86/X86GenRegisterInfo.inc。 该 文件 包含 在 X86RegisterInfo.cpp 
中 用 于 帮助 定义 X86RegisterInfo 类 。 除 这 些 内 容 以 外 ， 它 还 包含 处 理 器 寄存 器 的 枚 举 
类 型 ， 可 供 开发 人 员 在 调试 后 端 时 参考 。 例 如 ， 开 发 人 员 可 以 查找 寄存 器 与 数字 的 对 应 信息 
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(比如 哪个 寄存 器 与 数字 16 对 应 )。 

6.4.2.3 ”指令 

指令 格式 在 <Target>InstrFormats.td 中 定义 ， 而 指令 在 <Target>InstrInfo.td 
中 定义 。 指 令 格式 包含 了 二 进 制 形式 下 指令 中 不 同 的 编码 字段 ， 而 每 个 指令 记录 都 对 应 一 
条 指令 。 可 以 将 常见 的 特征 〈 例 如 ， 相 似 数据 处 理 指 令 的 常见 编码 ) 提取 出 来 ， 创 建 用 于 
派生 出 指令 记录 的 TableGen 中 间 指 令 类 。 每 个 指令 或 指令 格式 都 必须 是 定义 在 include/ 
llvm/Target/Target.td 中 的 Instruction TableGen 类 的 直接 或 间接 子 类 。 下 面 的 
代码 展示 指令 类 被 后 端 使 用 的 相关 字段 : 


class Instruction { 
dag OutOperandList; 
dag InOperandList,; 
string AsmString = "" 
list<dag> Pattern; 
list<Register> Uses = []; 
list<Register> Defs = []; 
list<Predicate> Predicates = []; 
bit isReturn = 0; 
bit isBranch = 0; 


dag 是 一 个 特殊 的 TableGen 类 型 ， 用 于 保存 SelectionDAG 节点 。 这 些 节点 代表 在 
指令 选择 阶段 中 的 操作 码 、 寄 存 器 或 常数 。 上 述 代码 中 各 字段 的 描述 如 下 : 

e OutOperandList 字段 存储 结果 节点 ， 后 端 可 以 根据 该 字段 识别 代表 指令 结果 的 
DAG 节点 。 例 如 ， 在 MIPS ADD 指令 中 ， 该 字段 被 定义 为 (outs GP320pnd:$rd)。 
在 这 个 例子 中 : 

口 outs 是 一 个 特殊 的 DAG 节点 ， 表 示 它 的 子 节点 是 输出 操作 数 。 

口 GPR320pnd 是 MIPS 特有 的 DAG 节点 ， 用 来 指示 一 个 MIPS 32 位 通用 寄存 器 的 实例 。 
口 $rd 是 一 个 用 于 标识 节点 的 任意 寄存 器 名 称 。 

InOperandList 字 上 段 保 存 输入 节点 ， 例 如 在 MIPS ADD 指 令 中 的 "(ins 
GPR320pnd:S$rs,GPR320pnd:$rt)"。 

Asmstring 字段 表示 汇编 指令 的 字符 串 ， 例 如 在 MIPS ADD 指令 中 的 "add $ 
ra: SEB,p $EC"o 

Pattern 是 指令 选择 期 间 将 用 于 进行 模式 匹配 的 dag 对 象 列表 。 如 果 模 式 匹配 成 
功 ， 则 指令 选择 阶段 用 该 指令 替换 匹配 的 节点 。 例 如 在 MIPS ADD 指令 的 匹配 模式 
为 [(set GPR320pnd:$rd, (add GPR320pnd:$rs, GPR320pns :Srt) ) ]， 
在 [与 ] 之 间 的 代码 对 应 于 只 有 一 个 DAG 元 素 的 列表 ， 该 元 素 的 定义 语法 与 LISP 
类 似 。 

Uses 和 Defs 字段 分 别 代表 执行 此 指令 时 隐 式 使 用 和 定义 的 寄存 器 的 列表 。 例 如 ， 
RISC 处 理 器 架构 的 返回 指令 隐 式 地 使 用 返回 地 址 寄存 器 ， 而 调用 指令 隐 式 地 定义 返 
回 地 址 寄存 器 。 
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e Predicates 字段 存储 在 指令 选择 阶段 尝试 匹配 指令 之 前 被 检查 的 先决 条 件 的 列表 。 
如 果 该 先决 条 件 检查 失败 ， 则 不 进行 模式 匹配 。 例 如 ， 某 个 谓词 可 能 声明 该 指令 只 
对 一 个 特定 的 子 目标 有 效 。 如 果 运 行 带 有 某 个 目标 三 元 组 信息 的 代码 生成 器 选择 了 
另外 一 个 子 目 标 ， 则 此 谓词 将 评估 为 失败 ， 并 且 不 进行 指令 匹配 。 

e 其 他 字段 包括 isReturn 和 isBranch 等 ， 它 们 为 代码 生成 器 提供 关于 指令 行为 的 
额外 人 信息。 例如， 如 果 isBranch=1， 则 代码 生成 器 可 以 知道 该 指令 是 分 支 ， 并 且 
必须 存在 于 每 个 基本 块 的 末尾 。 

在 下 面 的 代码 块 中 ， 可 以 看 到 sparcInstrInfo.td 中 XNORTL 指令 的 定义 。 它 使 用 

F3_1 格式 (在 SparcInstrFormats.td 中 定义 ), 该 格式 涵盖 了 SPARC V8 处 理 器 架构 
手册 中 的 部 分 F3 格式 : 


def XNORrr : F3 1<2, 0b000111, 


(outs IntRegs:$dst), (ins IntRegs:$b, IntRegs:$c), 
"Ro HD Hey Mastr. 
[(set i32:$dst, (not (xor i32:;$b, i32:$c)))]>; 


XOORrr 指令 有 两 个 IntRegs (代表 SPARC 32 位 整 型 寄存 器 类 的 目标 相关 DAG 节点 ) 
源 操作 数 和 一 个 IntRegs 结果 ， 如 在 OutOperandList=(outs IntRegs:$dst) 和 
InOperandList=(ins IntRegs:S$b，IntRegs:S$c) 中 所 见 。 

Rsmstring 汇 编程 序 是 指使 用 $ 记 号 指定 的 操作 数 : "xnor S$b, S$c, S$dst"。 
Pattern 字段 的 列表 元 素 (set i32:$dst，(not(xor i32:$b，i32:$c))) 包含 应 
当 与 指令 匹配 的 SelectionDAG 节点 。 例 如 ， 只 要 xor 指令 的 结果 通过 not 指令 被 位 反 
转 并 且 xor 指令 的 两 个 操作 数 都 是 寄存 器 ， 则 XNORrr 指令 就 会 被 匹配 。 

可 以 使 用 以 下 命令 序列 检查 XNORrr 指令 记录 字段 : 


$ cd <llvm sources>/lib/Target/Sparc 


$ llvm-tblgen -print-records Sparc.td -I ../../../include | grep XNORrr 
-A 10 


多 个 TableGen 后 端 利 用 指令 记录 的 信息 来 完成 其 功能 ， 从 相同 的 指令 记录 生成 不 同 
的 .inc 文件 。 这 与 TableGen 创建 一 个 核心 代码 仓库 以 便 将 代码 生成 到 后 端的 多 个 部 分 的 
目标 是 一 致 的 。 以 下 每 一 个 文件 均 由 不 同 的 TableGen 后 端 生 成 : 
e <Target>GenDAGISel.inc: 该 文件 使 用 指令 记录 中 patterns 字段 的 信息 来 输 
出 相应 的 代码 ， 以 选择 SelectionDAG 数据 结构 的 指令 。 该 文件 包含 在 <Target> 
ISelDAGtoDAG .cpp 文件 中 。 
e <Target>GenInstrInfo.inc: 作为 众多 指令 描述 表 的 一 员 ， 该 文件 包含 用 于 列举 目 
标 机 器 中 所 有 指令 的 枚 举 类 型 。 该 文件 包含 在 <Target>InstrInfo.cpp、<Target> 
InstrIinfo.h、 <Target>MCTargetDesc.cpp 和 <Target>MCTargetDesc.h 
中 。 但 是 ， 在 包含 该 TableGen 生成 文件 之 前 ， 每 个 文件 都 会 定义 一 组 特定 的 宏 ， 从 
而 更 改 文件 在 每 个 上 下 文中 的 解析 和 使 用 方式 。 
e <Target>GenAsmWriter.inc : 该 文件 包含 的 代码 用 于 打印 每 个 指令 汇编 码 的 字 
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符 串 。 它 包含 在 <Target>RsmPrinter .cpp 文件 中 。 

e <Target>GenCodeEmitter.inc : 该 文件 包含 用 于 将 每 个 指令 输出 为 二 
进 制 码 的 代码 ， 最 终 被 用 于 生成 目标 文件 中 的 机 器 码 。 它 包含 在 <Target> 
CodeEmitter .cpp 文件 中 。 

e <Target>GenDisassemblerTables.inc : 该 文件 实现 能 够 解码 字 节 序列 并 识 
别 它 所 代表 的 目标 指令 的 表格 和 算法 。 它 用 于 实现 反 汇 编 器 ， 并 包含 在 <Target> 
Disassembler .cpp 文件 中 。 

e <Target>GenAsmMatcher.inc : 该 文件 实现 目标 指令 汇编 器 的 解析 响 。 
<Target>AsmParser.cpp 文件 中 两 次 引用 它 ， 每 次 引用 对 应 于 一 组 不 同 的 预 处 
理 宏 ， 从 而 改变 该 文件 的 解析 方式 。 


6.5 ”指令 选择 阶段 介绍 

指令 选择 是 将 LLVM IR 转换 为 代表 目标 指令 的 SelectionDAG 节点 (SDNode) 的 过 程 。 
第 一 步 是 从 LLVM IR 指令 构建 DAG， 从 而 创建 一 个 其 节点 执行 IR 操作 的 selectionDRG 
对 象 。 然 后 ， 对 这 些 节点 执行 降级 、DAG 组 合 器 和 合法 化 阶段 ， 使 其 能 更 容易 与 目标 
指令 相 匹 配 。 然 后 ， 指 令 选 择 算法 使 用 节点 模式 匹配 进行 DAG 到 DAG 的 转换 ， 并 将 
SelectionDAG 节点 转换 成 代表 目标 指令 的 节点 。 


指令 选择 流程 是 后 端 代码 中 执行 时 间 最 长 的 流程 之 一 。 一 项 基于 SPEC CPU2006 
基准 测试 的 研究 表明 ， 指 令 选 择 流程 的 平均 花费 时 间 几 乎 占据 11c 工具 (LLVM 
3.0 ) 中 使 用 -02 级 优化 生成 x86 代码 所 花费 时 间 的 一 半 。 如 果 有 兴趣 了 解 在 所 
有 -02 级 别 下 目标 无 关 和 目标 相关 的 流程 中 所 花费 的 平均 时 间 ， 可 以 查看 LLVM 
JIT 编译 成 本 分 析 技 术 报 告 的 附录 ， 网 址 为 http://www.ic.unicamp .BR/ 
一 RELTECH/2013/13-13.pdf。 


6.5.1 SelectionDAG 类 


SelectionDAG 类 使 用 DAG 来 表示 每 个 基本 块 的 计算 ,每 个 SDNode 对 应 一 个 指令 或 操 
作 数 。 图 6-2 由 LLVM 生成 ， 描 述 只 有 一 个 函数 和 一 个 基本 块 的 sum.bc 文件 的 DAG。 

图 6-2 中 的 箭头 线条 代表 两 个 操作 之 间 具 有 顺序 性 的 use-def 关系 。 如 果 节 点 B (例如 ， 
add) 具有 指向 节点 A (例如 ，cConstant <-10>) 的 箭头 线条 ， 则 意味 着 节点 A ( 32 位 整 
数 -10 ) 定义 了 节点 B 所 使 用 的 变量 (作为 加 法 指令 的 一 个 操作 数 )。 因 此 ，A 的 操作 必须 
在 B 之 前 执行 。 黑 色 实 线 箭 头 的 常规 线条 表示 如 add 示例 一 样 的 数据 流 依赖 性 。 蓝 色 虚 线 
箭头 线条 表示 非 数据 流 链 ， 强 制 规定 两 条 不 相关 的 指令 之 间 的 执行 顺序 ， 例 如 ， 如 果 访 问 相 
同 的 内 存 地 址 ， 则 加 载 和 存储 指令 必须 保持 其 原始 程序 的 顺序 。 根 据 上 图 中 的 蓝 色 虚线 ， 我 
们 知道 CopyToReg 操作 必须 在 X86ISD: :RET FLAG 之 前 发 生 。 红 色 的 线条 要 求 确保 它 
的 相 邻 节点 必须 在 一 起 执行 ， 即 它们 之 间 不 能 执行 其 他 任何 指令 。 例 如 ， 上 述 例子 中 因为 红 


色 线 条 的 缘故 ， 节 点 CopyToReg 和 X86ISD: :RET _FLRG 必须 被 安排 在 一 起 执行 。 


EntryToken [ORD=1] Register %vreg0 [ORD=1] 
7/ 


WE Constant<-10> [ORD=1] 


CopyFromReg [ORD=1] 


i 





图 6-2 


每 个 节点 可 以 根据 与 消费 者 的 关系 提供 不 同类 型 的 值 。 值 不 一 定 是 具体 的 ， 也 可 能 是 一 
个 抽象 的 记号 。 它 可 能 是 以 下 任何 一 种 类 型 ; 

e 节点 提供 的 值 可 以 是 表示 整数 、 浮 点 数 、 向 量 或 指针 的 具体 值 类 型 。 数 据 处 理 节点 

的 结果 就 是 这 个 类 别 的 一 个 例子 ， 该 结果 是 根据 操作 数 计 算出 的 新 值 。 类 型 可 以 是 
i32、i64、f32、v2f32 (具有 两 个 f32 元 素 的 向 量 ) 和 iPTR 等 。 当 另 一 个 节点 
使 用 这 个 值 时 ， 生 产 者 与 消费 者 关系 在 LLVM 图 中 用 常规 的 黑 线 表 示 。 

e Other 类 型 是 用 于 表示 链 值 的 抽象 记号 (图 中 的 ch)。 当 另 一 个 节点 使 用 这 种 类 型 

值 时 ， 连 接 两 者 的 边 将 在 LLVM 图 中 以 蓝 色 虚线 打印 。 
e Glue 类 型 代表 粘连 节点 。 当 另 一 个 节点 使 用 Glue 类 型 值 时 ， 连 接 两 个 节点 的 线 将 
在 LLVM 图 中 以 红色 表示 。 

SelectionDAG 对 象 有 一 个 表示 基本 块 入 口 的 特殊 EntryToken 节点 ， 该 节点 对 应 
一 个 类 型 为 other 的 值 ， 以 允许 节点 链 使 用 它 作 为 起 点 。SelectionDAG 对 象 同时 还 维护 
对 DAG 图 的 根 节 点 的 引用 ， 该 根 节点 位 于 最 后 一 条 指令 之 后 ， 根 节点 和 最 后 一 条 指令 的 关 
系 也 被 编码 为 一 条 other 类 型 的 值 链 。 

在 此 阶段 ， 经 过 诸如 降级 和 合法 化 等 负责 使 DAG 图 做 好 指令 选择 准备 的 预备 步骤 之 
后 ， 目 标 无 关 和 目标 相关 的 节点 可 以 共存 。 但 在 指令 选择 结束 之 前 ， 所 有 与 目标 指令 成 功 
匹配 的 节点 都 将 是 目标 相关 的 。 在 图 6-2 中 ， 我 们 有 以 下 目标 无 关 的 节点 : CopyToReg、 
CopyFromReg、Register(%vreg0)、add 和 Constant。 另 外 ， 我 们 有 以 下 已 经 被 预 处 
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理 ， 并 且 是 特定 于 目标 的 节点 (尽管 它们 在 指令 选择 之 后 仍然 可 以 改变 ):; TargetConstant、 
Register(%EAX) 和 X86ISD: :RET FLRG。 

我 们 还 可 能 从 示例 图 中 观察 到 以 下 语义 : 

e Register: 此 节点 可 能 引用 虚拟 或 物理 (特定 于 目标 ) 的 寄存 器 。 

e CopyFromReg : 该 节点 复制 在 当前 基本 块 作 用 范围 之 外 定义 的 寄存 器 ， 从 而 允许 我 

们 在 当前 上 下 文中 使 用 它 ， 在 前 面 的 例子 中 ， 它 复制 了 一 个 函数 参数 。 

e CopyToReg : 该 节点 将 一 个 值 复制 到 一 个 指定 的 寄存 器 ， 此 过 程 中 不 输出 任何 可 被 
其 他 节点 使 用 的 具体 值 。 但 是 ， 该 节点 会 生成 〈 类 型 为 othez 的 ) 链 值 ， 以 便 与 其 
他 不 生成 具体 值 的 节点 链接 。 例 如 ， 要 使 用 写 和 人 EAX 的 值 ，X86ISD: :RET_FLRG 
节点 使 用 由 Register(%EAX) 节点 提供 的 i32 结果 ， 并 使 用 CopyToReg 生成 
的 链 。 该 链 强 制 CopyToReg 在 X86ISD: :RET_FLAG 之 前 被 调度 ， 因 此 确保 用 
CopyToReg 更 新 $EAX。 

要 深入 了 解 SelectionDAG 类 的 详细 信息 ， 请 参阅 1lvm/include/llvm/CodeGen/ 
SelectionDAG.h 头 文件 。 对 于 节点 结果 类 型 ， 可 以 参阅 llvm/include/llvm/CodeGen/ 
ValueTypes .h 头 文件 。 头 文件 11vm/include/1LLvm/codeGen/ISDOpcodes .h 包含 目 
标 无 关节 点 的 定义 ， 而 lib/Target/<Target>/<Target>ISelLowering.h 定 义 目 
标 相 关 的 节点 。 


6.5.2 ”降级 
前 面 展示 了 一 个 图 表 ， 其 中 特定 于 目标 的 节点 和 与 目标 无 关 的 节点 共存 。 你 可 能 对 此 有 
疑问 ， 如 果 这 是 指令 选择 阶段 的 输入 ， 那 么 为 什么 在 SelectionDAG 类 中 已 经 有 一 些 特定 


于 目标 的 节点 ?为 了 理解 这 一 点 ， 我 们 首先 来 看 图 6-3， 该 图 显示 指令 选择 之 前 的 所 有 处 理 
步骤 (从 左上 角 的 LLVM IR 步骤 开始 ): 


SelectionDAGBuilder 








图 6-3 


首先 , 一 个 SelectionDAGBuilder 实例 (更 多 细节 请 见 SelectionDAGISel .cpp) 
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访问 每 个 函数 ， 并 为 每 个 基本 块 创建 一 个 SelectionDAG 对 象 。 在 这 个 过 程 中 ， 某 些 特殊 
的 IR 指令 (如 call 和 ret) 已 经 需要 遵循 特定 于 目标 机 器 的 习惯 用 法 (例如 ， 如 何 传递 函 
数 调用 的 参数 以 及 如 何 从 函数 返回 等 )， 以 便 转换 成 SelectionDAG 节点 。 解 决 这 个 问题 
需要 用 到 TargetLowering 类 中 的 算法 ， 这 个 类 是 一 个 抽象 接口 ， 每 个 编译 目标 都 必须 实 
现 该 类 ,但 是 它 还 是 有 许多 在 所 有 的 编译 目标 中 通用 的 功能 。 

为 了 实现 这 个 抽象 接口 ( TargetLowering 类 )， 每 个 编译 目标 都 需要 声明 一 个 名 为 
<Target>TargetLowering 的 TargetLowering 子 类 。 每 个 目标 也 需要 重 载 那 些 有 关 
将 高 层次 的 目标 节点 降低 到 更 低层 次 、 更 接近 目标 机 絮 的 函数 。 正 如 预期 的 那样 ， 只 有 一 
小 部 分 节点 以 这 种 方式 降低 ， 大 部 分 的 其 他 节点 中 则 在 指令 选择 时 被 匹配 和 替换 。 比 如 在 
sum.bc 文件 的 SelectionDAG 中 ,X86TargetLowering::LowerReturn( ) 方法 ( 见 
lib/Target/X86/X86ISelLowering.cpp) 被 用 于 对 IR ret 指令 降级 。 该 操作 将 生 
成 X86ISD: :RET_FLAG 节点 ， 此 节点 将 函数 结果 复制 到 EAX 寄存 器 ， 这 是 特定 于 编译 目 
标 (X86 ) 的 函数 返回 处 理 方式 。 


6.5.3 ”DAG 合并 以 及 合法 化 


从 SelectionDAGBuilder 产生 的 输出 SelectionDAG 还 必须 经 过 图 6-3 所 示 的 其 
他 转换 才能 进行 指令 选择 。 指 令 选 择 之 前 的 流程 顺序 如 下 : 

e DAG 合并 流程 对 次 优 的 SelectionDAG 结构 进行 优化 ， 为 此 ， 它 首先 进行 节点 
匹配 ， 并 尽 可 能 使 用 更 为 简单 的 结构 替换 当前 节点 。 例 如 ， 子 图 (add (Register 
X)，(constant 0) ) 可 以 被 直接 折 麦 为 (Register X)。 与 此 类 似 ， 特 定 于 目 
标的 合并 过 程 可 以 识别 节点 的 模式 并 通过 合并 或 者 折 麦 等 方式 提高 其 对 于 指定 目 
标的 指令 选择 质量 。 你 可 以 在 lib/CodeGen/SelectionDAG/DAGCombiner. 
cpp 文件 中 找到 LLVM 常见 DAG 合并 优化 实现 ， 并 在 lib/Target/<Target_ 
Name>/<Target>ISelLowering.cpp 文件 中 找到 特定 于 目标 的 合并 优化 实现 。 
函数 setTargetDAGCombine( ) 负责 标记 当前 编译 目标 下 应 该 合并 的 节点 。 例 如 ， 
MIPS 后 端 试图 合并 加 法 。 请 参阅 lib/Target/Mips/MipsISelLowering.cpp 
中 的 setTargetDAGCombine (ISD: :ADD) 和 performADDCombine()。 


DAG 合并 在 每 个 合法 化 阶段 后 运行 ， 以 最 小 化 SelectionDRG 的 宛 余 。 此 
外 ，DAG 合并 知道 其 在 当前 编译 器 所 处 的 阶段 (例如 类 型 合法 化 或 向 量 合法 化 
之 后 )， 这 些 信 息 使 得 该 合并 过 程 可 以 更 加 精确 。 


e 类 型 合法 化 流程 保证 指令 选择 阶段 只 需 处 理 合法 类 型 。“ 合 法 类 型 ”是 指 编译 目标 
原生 支持 的 类 型 。 例 如 ， 对 于 仅 支 持 i32 类 型 的 目标 ， 操 作 数 为 i64 的 加 法 操作 是 
非法 的 。 对 于 这 种 情况 ， 类 型 合法 化 工具 integer expansion 会 将 i64 操作 数 拆 分 成 
两 个 i32 操作 数 ， 同 时 插入 适当 的 处 理 节点 。 具 体 而 言 ， 编 译 目 标 会 事先 定义 好 寄 
存 器 类 与 每 个 类 型 的 对 应 关系 ， 从 而 明确 声明 其 所 支持 的 类 型 。 在 此 基础 上 ， 编 译 


104 第 6 蝎 


器 必须 检测 和 处 理 非法 类 型 : 标量 类 型 可 以 被 提升 或 者 扩展 ， 矢 量 类 型 可 以 被 分 
割 、 标 量化 或 者 填充 (这 些 处 理 的 解释 请 参见 llvm/include/llvm/Target/ 
TargetLowering.h)。 编 译 目 标 也 可 以 通过 自 定义 方法 来 合法 化 类 型 。 类 型 合法 
化 流程 运行 两 次 ， 分 别 在 第 一 次 DAG 合并 后 和 矢量 合法 化 后 。 

有 些 情 况 下 ， 后 端 可 以 直接 支持 向 量 类 型 ， 这 意味 着 它 有 一 个 相应 的 寄存 器 类 ， 但 
是 它 可 能 不 支持 某 些 针对 给 定向 量 类 型 的 特定 操作 。 例 如 ， 具 有 SSE2 的 x86 架构 支 
持 v4i32 向 量 类 型 。 但 该 架构 不 支持 对 于 v4i32 类 型 的 ISD: :OR 操作 ,但 仅 支 持 
v2i64 类 型 。 因 此 矢量 合法 化 工具 需要 处 理 这 些 情况 ,并 使 用 合法 的 类 型 和 指令 提 
升 或 扩展 操作 。 编 译 目标 也 可 以 通过 自 定义 的 方式 处 理 合法 化 问题 。 读 者 可 以 查看 
lib/Target/X86/X86ISelLowering.cpp 的 以 下 代码 片段 : 


setOperationAction(ISD: :OR, v4i32, Promote); 
AddPromotedToType (ISD: :OR, v4i32, MVT::v2i64); 


CW 对 于 某 些 类 型 ， 扩 展 将 删除 矢量 并 使 用 标量 。 这 可 能 会 导致 产生 不 被 编译 
~ 目标 支持 的 标量 类 型 ， 因 此 还 需要 后 续 的 类 型 合法 化 实例 对 其 进行 清除 。 


DAG 合法 化 程序 与 矢量 合法 化 程序 具有 相同 的 作用 ， 但 它 负 责 处 理 对 不 支持 类 型 
(标量 或 矢量 ) 的 所 有 剩余 操作 。 它 也 包含 有 例如 提升 、 扩 展 、 自 定义 节点 处 理 等 之 
前 解释 过 的 操作 。 例 如 ，x86 架构 不 支持 以 下 三 种 中 的 任何 一 种 : i8 类 型 的 带 符号 
整数 与 浮 点 转换 (ISD: :SINT_TO_FP)， 这 要 求 合 法 器 进行 提升 操作 ; i32 类 型 的 
带 符号 整数 除法 操作 (ISD: :SDIV)， 这 要 求 合 法 器 进行 扩展 操作 并 调用 相应 库 函 数 
来 处 理 除法 ; £32 类 型 的 浮 点 数 绝对 值 操作 ( ISD: :FABS), 合法 器 通过 自 定义 处 理 
程序 生成 具有 相同 效果 的 代码 。x86 的 合法 器 以 如 下 方式 完成 这 些 操 作 (参见 1ib/ 
Target/X86/xX86ISelLowering.cpp): 


setOperationAction(ISD: :SINT TO FP, MVT::i8, Promote); 
setOperationAction(ISD: :SDIV, MVT::i32, Expand); 
setOperationAction (ISD: :FABS, MVT::f£f32, Custom); 


6.5.4 DAG 到 DAG 指令 选择 


DAG 到 DAG 指令 选择 的 目的 是 通过 使 用 模式 匹配 将 目标 无 关节 点 转换 成 目标 相关 节 
点 。 指 令 选择 算法 是 一 个 局 部 算法 ， 每 次 在 SelectionDAG (基本 块 ) 实例 上 执行 。 

举 个 例子 ， 我 们 接 下 来 将 介绍 在 完成 指令 选择 之 后 最 终 的 SelectionDRG 结构 。 
CopyToReg、CopyFromReg 和 Registe 节点 是 不 变 的， 一 直 保留 到 寄存 器 分 配 阶 段 。 实 
际 上 ， 指 令 选择 阶段 可 能 会 产生 额外 的 这 些 指令 。 在 指令 选择 阶段 之 后 ，ISD: :RDD 节点 被 
转换 为 X86 指令 ADD32ri8， 而 X86ISD::RET _FLRG 指令 被 转换 成 RET， 如 图 6-4 所 示 。 


放生 同一 个 DAG 中 可 能 出 现 三 种 类 型 的 指令 表示 形式 共存 的 情况 : 比如 
一 ISD::RADD 的 通用 LLVM ISD 节点 ， 比 如 X86ISD::RET FLRG 的 特定 于 目标 
的 <Target>ISD 节点 和 比如 X86::ADD32ri8 的 目标 实际 指令 。 


EntryToken [ORD=1] Register %vreg0 [ORD=1] 
; 


TargetConstant<-10> 


Register %EAX 





模式 匹配 

每 个 编译 目标 都 通过 在 名 为 <Target_Name>DAGTODAGISel 的 SelectionDRGISel 子 
类 中 实现 Select 方法 来 进行 指令 选择 (例如 SPARC 中 的 sparcDAGToDAGISel: :Select()， 
请 参阅 文件 1ib/Target/Sparc/SparcISelDAGTODAG .cpp)。 该 方法 接收 一 个 待 匹配 的 
SDNode 作为 参数 ， 并 返回 表示 实际 指令 的 SDNode 值 ， 否 则 会 发 生 错 误 。 

Select() 方法 允许 以 两 种 方式 来 匹配 实际 指令 。 最 直接 的 方法 是 通过 调用 从 
TableGen 模式 生成 的 匹配 代码 ， 如 以 下 列表 的 步骤 1 所 示 。 但 是 ， 生 成 的 匹配 模式 可 能 不 
足以 应 付 某 些 指令 的 不 常见 行为 。 在 这 种 情况 下 ， 必 须 使 用 以 下 列表 的 第 2 步 所 示 的 方法 编 
写 定制 化 的 C++ 匹配 逻辑 实现 。 方 法 细节 如 下 : 

1. Select( ) 方法 调用 Selectcode( )。TableGen 工具 为 每 个 编译 目标 生成 Select- 
code( ) 方法 ， 在 此 代码 中 ， 包 含有 将 ISD 和 <Target>ISD 节点 映射 到 实际 指令 节点 的 
MatcherTable 匹配 表 。 该 匹配 表 是 从 .td 文件 (通常 是 <Target>InstrInfo.td) 中 
的 指令 定义 生成 的 。selectCcod( ) 方法 最 后 调用 Selectcodecommo ( ) ， 后 者 是 一 个 与 目 
标 相关 的 函数 ， 以 便 通 过 使 用 之 前 生成 的 匹配 表 来 匹配 节点 。TableGen 有 一 个 专门 的 指令 
选择 后 端 来 生成 这 些 函 数 和 匹配 表 : 
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$ cd <llvm source>/1ib/Target/sSparc 
$ llvm-tblgen -gen-dag-isel Sparc.td -1 ../../../include 

对 于 每 个 编译 目标 ， 上 述 代码 的 C++ 输出 代码 保存 在 文件 <builq dir>/1ib/Tar 
get/<Target>/<Target>GenDAGISel.inc 中 ,例如 ，SPARC 架构 对 应 的 <build_ 
dir>/lib/Target/Sparc/SparcGenDAGISel.inc 文件 。 

2. 在 调用 Selectcode() 之 前 在 select() 中 提供 定制 化 的 匹配 代码 。 例 如 在 i32 
节点 类 型 TSD : :MULHU 执行 两 个 i32 类 型 操作 数 的 乘法 ， 产 生 一 个 i64 类 型 结果 ， 并 返 
回 高 位 i32 部 分 。 在 32 位 SPARC 架构 中 ， 乘 法 指令 SP: :UMULrr 通过 特殊 寄存 器 Y 返 
回 结果 中 较 高 的 部 分 ， 该 寄存 器 需要 SP: :RDY 指令 才能 读 取 。TableGen 无 法 实现 该 处 理 逻 
辑 ， 因 此 我 们 用 下 面 的 代码 来 解决 这 个 问题 : 


case ISD: :MULHU: { 
SDValue MulLHS = N->getOperand(0); 
SDValue MulRHS = N->getOperand(1); 
SDNode *Mul = CurDAG->getMachineNode (SP::UMULrr, dl, 
MVT: :i32, MVT: :Glue, MulLHS, MulRHS); 
return CurDAG->SelectNodeTo(N, SP::RDY, MVT::i32, 
SDValue (Mul, 1)); 


} 

在 上 述 代码 中 ，N 是 要 匹配 的 SDNode 参数 ， 在 这 种 情况 下 , N 等 于 ISD: :MULHU。 
由 于 在 case 语句 之 前 已 经 执行 了 规范 性 检查 ， 我 们 继续 生成 SPARC 指定 的 操作 码 以 取 
代 ISsD: :MULHU。 为 此 ， 我 们 调用 curDAG->getMachineNode() 来 创建 一 个 带 有 实 
际 指令 SP::UMULrr 的 节点 。 接 下 来 ,通过 调用 curDAG->SelectNodeTo()， 创建 
一 个 SP: :RDY 指令 节点 ， 并 将 所 有 使 用 的 ISD: :MULHU 结果 改 为 指向 SP: :RDY 的 结 
果 。 图 6-5 显示 指令 选择 阶段 前 后 的 SelectionDAG 结构 。 前 面 的 C++ 代码 片段 是 1ib/ 
Target/Sparc/SparcISelDAGTODAG .cpp 中 代码 的 简化 版 本 。 


CTT 





6.5.5 ”指令 选择 过 程 可 视 化 


llc 工具 中 存在 几 个 可 以 对 SelectionDRG 类 在 指令 选择 的 不 同 阶段 进行 可 视 化 的 选 
项 。 可 以 使 用 这 些 选 项 生成 一 个 类 似 于 本 章 前 面 所 显示 的 .dot 图 结构 ， 但 需要 使 用 dot 
程序 来 显示 它 ， 或 用 dotty 编辑 它 。 这 些 工 具 可 以 从 www.graphviz.org 的 Graphviz 
包 中 获取 。 表 6-2 展示 按照 执行 顺序 排序 的 所 有 选项 : 


表 6-2 选项 列表 

lic 选项 阶段 
-view-dag-combinel-dags DAG 合并 1 之 前 
-view-legalize-types-dags 合法 化 类 型 之 前 
-View-dag-combine-1lt-dags 合法 化 类 型 2 之 后 和 DAG 合并 之 前 
-view-legalize-dags 合法 化 之 前 
-view-dag-combine2-dags DAG 合并 2 之 前 
-view-isel-dags 指令 选择 之 前 
-view-sched-dags 指令 选择 之 后 和 调度 之 前 


6.5.6 快速 指令 选择 

LLVM 还 支持 一 种 称 为 快速 指令 选择 的 算法 (对 应 于 FastISel 类 ,位 于 <llvm_ 
source>/1ib/codeGen/SelectionDRG/FastISel.cpp 文件 中 )。 人 快速 指令 选择 牺 
牲 代码 质量 换取 快速 的 代码 生成 ， 这 符合 -00 优化 级 别 流 程 的 原理 。 速 度 上 的 增益 来 自 避 
免 复杂 的 折 熙 和 降级 逻辑 。 对 于 简单 操作 ， 该 算法 使 用 TableGen 描述 ， 但 对 于 更 为 复杂 的 
指令 匹配 ， 仍 然 需 要 特定 于 目标 的 处 理 代码 。 


-00 流程 还 使 用 了 更 为 快速 但 不 是 最 佳 的 寄存 器 分 配器 和 调度 器 ， 这 同样 是 牺 
牲 代 码 质量 来 提高 编译 速度 。 我 们 将 在 后 面 介绍 它们 。 


6.6 调度 器 


在 指令 选择 阶段 之 后 ，SelectionDAG 结构 将 具有 代表 实际 指令 的 节点 ， 这 些 指令 能 直 
接 运 行 在 目标 处 理 器 上 。 下 一 阶段 包括 对 SelectionDAG 节点 (SDNodes ) 进行 寄存 器 预 分 
配 调度 。LLVM 提供 了 几 个 不 同 的 调度 程序 ， 它 们 都 是 ScheduleDaGSDNodes 的 子 类 (请 参 
阅 文 件 <llvm_source>/1lib/CodeGen/SelectionDAG/ScheduleDAGSDNodes .cpp)。 
开发 人 员 可 以 使 用 11c 工具 的 -pre-RA-sched=<scheduler> 选项 来 选择 调度 程序 类 
型 。<scheduler> 的 可 能 值 如 下 : 

e list-ilp、list-hybrid、source 和 1ist-burr: 这 些 选项 引用 由 ScheduleDAGRR 
List 类 (参见 文件 <llvm_source>/1ib/CodeGen/SelectionDAG/ScheduleDAGRR 
List.cpp) 实现 的 列表 调度 算法 。 

efast: ScheduleDAGFast 类 (在 <llvm source>/lib/CodeGen/ 
SelectionDAG/ScheduleDAGFast .cpp 中 ) 实现 次 优 但 快速 的 调度 器 。 
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e vliw-td: 由 ScheduleDRAGVLIW 类 实现 的 专门 针对 VLIW 架构 的 调度 程序 (请 参 
阅 文 件 <llvm_source>/1ib/CodeGen/SelectionDAG/ScheduleDAGVLIW. 
cpp)。 
default 选项 自动 为 目标 选择 最 佳 预定 义 调度 程序 ， 而 1inearize 选项 不 执行 任何 
调度 。 这 些 调 度 程序 都 可 能 根据 详细 的 指令 执行 进程 表 和 竞争 关系 等 信息 来 更 好 地 完成 指令 
调度 任务 。 


代码 生成 器 中 有 三 个 不 同 的 调度 程序 执行 方式 : 两 个 在 寄存 器 分 配 之 前 ， 一 个 在 
寄存 器 分 配 之 后 。 第 一 个 对 SelectionDAG 节点 执行 ， 另 外 两 个 对 机 器 指令 执 
行 ， 本章 随后 将 进一步 解释 。 


6.6.1 指令 执行 进程 表 

某 些 目标 机 器 提供 包括 指令 延迟 和 硬件 流程 信息 的 指令 执行 进程 表 (Instruction 
Itinerary) 。 调 度 程 序 在 调度 决策 期 间 使 用 这 些 属 性 来 最 大 化 吞吐 量 并 避免 性 能 损失 。 这 
些 信息 在 每 个 目标 目录 下 的 TableGen 文 件 中 进行 描述 ， 其 文件 名 通常 为 <Target> 
Schedule.td (例如 ，X86Schedule.td)。 

LLVM 在 <llvm source>/include/llvm/Target/TargetItinerary.td 中 
提供 ProcessorItineraries TableGen 类 ， 如 下 所 示 : 


class ProcessorItineraries<list<FuncUnit> fu, list<Bypass> bp, 
list<InstrItinData> iid> { 


编译 目标 可 以 为 单一 处 理 器 架构 或 处 理 器 系列 定义 指令 的 执行 进程 表 。 为 此 ， 编 译 
目标 必须 提供 关于 执行 单元 (FuncUnit)、 管 道 旁 路 (Bypass) 和 指令 执行 进程 数据 
(InstrItinData) 的 列表 。 例 如 ，ARM Cortex A8 指令 的 执行 进程 表 位 于 <11vm_source> 
/lib/Target/ARM/ARMScheduleA8 .td 中， 如 下 所 示 : 


def CortexA8Itineraries : ProcessorItineraries< 
[A8_Pipe0, A8 Pipel, A8_ LSPipe, A8 NPipe, A8_ NLSPipe], 
Clr 


InstrIitinData<IIC iALUi, [InstrStage<1， [A8 Pipe0, A8 Pipel]>], 
l2 213; 


1 


我 们 在 上 述 代码 中 没有 观察 到 旁 路 ,但 我 们 可 以 观察 到 该 处 理 器 的 执行 单元 列表 ( A8_ 
Pipe0、A8_Pipel 等 ) 以 及 来 自 IIC iALUi 类 型 的 指令 的 执行 进程 表 数 据 。 这 种 指令 
类 型 是 一 种 形 如 reg = reg + immediate 格式 的 二 进 制 指令 ， 比 如 ADDri 和 SUBri 指 
令 。 这 些 指 令 需 要 一 个 机 器 周期 来 完成 涉及 A8_Pipe0 和 A8_Pipel 执行 单元 的 阶段 ， 如 
InstrStage<1,[A8_Pipe0,A8_Pipel]> 中 所 定义 。 
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上 述 代 码 的 最 后 部 分 ， 列 表 [2,2] 表示 在 输出 指令 之 后 读 取 或 写 入 每 个 操作 数 所 需 
的 周期 数 。 在 上 面 的 例子 中 ,目标 寄存 器 (索引 0) 和 源 寄存 器 (索引 1 ) 在 2 个 周期 后 都 
可 用 。 


6.6.2 ”竞争 检测 


竞争 识别 器 通过 使 用 处 理 器 的 指令 执行 进度 表 中 的 信息 来 计算 竞争 关系 。Schedule 
HazardRecognizer 类 是 实现 竞争 识别 器 的 接口 ， 而 ScoreboardHazardRecognizer 
子 类 实现 了 基于 记分 板 的 竞争 识别 器 (请 参阅 文件 <llvm_source>/1ib/CodeGen/ 
Scoreboard-HazardRecognizer.cpp)， 它 也 是 LLVM 默认 的 竞争 识别 器 。 

在 TableGen 无 法 表达 特定 约束 的 情况 下 ， 可 以 为 编译 目标 提供 自己 的 竞争 识别 器 。 例 
如 ARM 和 PowerPC 都 提供 了 scoreboardHazardRecognizer 子 类 。 


6.6.3 调度 单元 


调度 程序 在 寄存 器 分 配 之 前 和 之 后 运行 。 但 是 ，SDNode 指令 表示 形式 仅 在 寄存 器 分 配 
之 前 可 用 ， 而 寄存 器 分 配 之 后 则 使 用 MachineInstr 类 。 为 了 处 理 SDNode 和 Machine- 
Instrs,SUnit 类 (参见 文件 <llvm_source>/include/llvm/CodeGen/schedule- 
DAG.h) 在 指令 调度 期 间 将 底层 指令 表示 抽象 为 调度 单元 。11lc 工具 可 以 通过 使 用 选 
项 -view-sunit-dags 来 打印 调度 单元 。 


6.7 机 器 指令 


寄存 器 分 配器 的 处 理 对 象 是 由 MachineInstr 类 (简称 MI， 定 义 于 <llvm_ 
source>/include/llvm/CodeGen/MachineInstr.h) 提供 的 指令 表示 形式 。 在 指 
令 调 度 之 后 运行 的 InstrEmitter 流程 将 SDNode 格式 转换 为 MachineInstr 格式 。 顾 
名 思 义 ， 这 个 表示 比 IR 指令 更 接近 实际 的 目标 指令 。 与 SDNode 格式 及 其 DAG 形式 不 同 ， 
MI 格式 是 程序 的 三 地 址 表示 ， 就 是 说 ， 它 是 指令 序列 而 不 是 DAG 图 ， 这 使 得 编译 器 能 够 
有 效 地 进行 调度 决策 ， 即 决定 每 条 指令 的 顺序 。 每 个 MI 指令 都 包含 有 一 个 操作 码 号 码 和 一 
个 操作 数列 表 ， 其 中 操作 码 号 码 是 一 个 只 对 特定 后 端 有 意义 的 数字 。 

通过 使 用 11c 工具 中 的 -print-machineinstrs 选项 ， 可 以 打印 所 有 已 注册 流程 
或 特定 指令 之 后 的 机 器 指令 ， 使 用 方法 为 -printmachineinstrs=<pass-name>。 流 
程 名 称 必 须 与 LLVM 源 代码 对 应 。 感 兴趣 的 读者 可 以 在 LLVM 源 代码 文件 夹 下 运行 grep， 
以 搜索 流程 用 来 注册 其 名 称 的 宏 : 


$ grep -r INITIALIZE PASS BEGIN * 


CodeGen/PHIElimination.cpp:INITIALIZE PASS BEGIN (PHIElimination, "phi- 
node-elimination" 


Cm 


例如 ,下面 是 sum.bc 文件 在 SPARC 架构 上 完成 所 有 流程 后 的 机 器 代码 : 


-人 
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$ llc -march=sparc -print-machineinstrs sum.bc 
Function Live Ins: $%I0 in %vreg0, %Il1 in %vregl 
BB#0: derived from LLVM BB %entry 
Live Ins: %I0 和 II 
%vregl<def> = COPY %Il; IntRegs:%vregl 
%vreg0<def> = COPY %I0; IntRegs:%vreg0 
%vreg2<def> = ADDrr %vregl, %vreg0; IntRegs:%vreg2,%vregl,%vreg0 
%I0O<def> = COPY %vreg2; IntRegs:%vreg2 
RETL 8, %I0<imp-use> 
MI 类 包含 有 关 指 令 的 重要 元 信息 : 它 存储 该 指令 使 用 和 定义 的 寄存 器 ， 并 区 分 寄存 器 
操作 数 和 内 存 操 作 数 (以 及 其 他 类 型 )， 存 储 指令 类 型 (分支 、 返 回 、 调 用 和 终止 符 等 )， 存 
储 谓词 (比如 是 否 可 交换 等 )。 保 留 这 些 信息 是 非常 重要 的 ， 即 使 在 MI 等 较 低 层次 也 是 如 
此 ， 因 为 在 InstrEmitter 之 后 和 代码 输出 之 前 运行 的 所 有 流程 都 依靠 这 些 信息 来 执行 分 析 。 


6.8 寄存 器 分 配 


寄存 器 分 配 的 基本 任务 是 将 数量 不 限 的 虚拟 寄存 器 转换 为 物理 (有 限 的 ) 寄存 器 。 由 于 
编译 目标 的 物理 寄存 器 数量 有 限 ， 因 此 需要 为 一 些 虚拟 寄存 器 分 配对 应 的 内 存 地 址 ， 即 溢出 
地 址 ( spill slots)。 然 而 ， 由 于 某 些 机 器 指令 需要 用 到 特定 寄存 器 来 存储 结果 ,或 者 ABI 有 
某 些 特殊 规定 ， 因 此 一 些 MI 代码 段 可 能 在 寄存 器 分 配 之 前 就 已 经 使 用 了 物理 寄存 器 。 对 于 
这 些 情况 ， 寄 存 器 分 配器 需要 遵守 现 有 的 分 配 结果 ， 并 将 其 他 物理 寄存 器 分 配给 剩余 的 虚拟 
寄存 器 。 

LLVM 寄存 器 分 配器 的 另 一 个 重要 作用 是 解构 IR 的 SSA 形式 。 直 到 此 时 ， 机 器 指令 还 
可 能 包含 从 原始 LLVM IR 复制 的 phi 指令 ,保留 这 些 指令 是 为 了 支持 SSA 形式 所 必需 的 ， 
以 便 帮 助 编译 器 实现 特定 于 机 器 的 优化 。 但 是 将 SSA 形式 还 原 为 正常 形式 需要 使 用 复制 指 
令 来 代替 phi 指令 。 而 寄存 器 分 配 阶 段 进行 的 正 是 分 配 寄存 器 和 消除 元 余 复 制 操作 等 任务 ， 
因此 解构 SSA 必须 在 寄存 器 分 配 之 前 进行 。 

LLVM 有 4 个 寄存 器 分 配 实现 ， 可 以 使 用 11lc 的 -regalloc=<regalloc name> 选 
项 选择 它们 。<regalloc_name> 选项 如 下 : pbqp、greedy、basic 和 fast。 

e pbqp : 该 选项 将 寄存 器 分 配 问题 映射 成 分 区 布尔 二 次 编程 (PBQP) 问题 。PBQP 求 
解 程序 用 于 将 此 问题 的 结果 映射 回 寄存 器 。 
greedy : 该 选项 提供 了 一 个 高 效 的 全 局 (整个 函数 ) 寄存 器 分 配 算法 ， 支 持 变量 生存 
周期 分 割 并 最 小 化 溢出 次 数 。 读 者 可 以 从 如 下 链接 找到 关于 该 算法 的 解释 : http:// 
blog.llvm.org/2011/09/greedy-register-allocation-in-llvm-30. 
html。 
basic : 该 选项 使 用 一 个 非常 简单 的 分 配器 ， 并 提供 一 个 扩展 接口 。 它 是 所 有 寄存 
器 分 配 效率 的 基准 线 ， 并 为 开发 人 员 实现 新 的 寄存 器 分 配器 提供 基础 。 可 以 在 上 面 
介绍 greed 算法 的 相同 文章 中 了 解 此 算法 。 
fast : 这 个 分 配器 算法 是 局 部 的 〈 基 于 每 个 基本 块 运行 )， 其 主要 思想 是 将 变量 保存 
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在 寄存 器 中 并 尽 可 能 地 多 次 重用 。 
default 分 配器 被 映射 到 4 个 选项 之 一 ， 并 根据 当前 优化 级 别 〈-0 选项 ) 进行 选择 。 
不 管 选择 哪 种 算法 ， 寄 存 器 分 配器 都 实现 于 一 个 流程 内 ， 但 它 仍 然 依 赖 于 其 他 分 析 过 
程 ， 这 些 过 程 组 成 了 分 配器 的 基本 框架 。 这 个 框架 包括 几 个 流程 ， 我 们 接 下 来 通过 介绍 
寄存 器 合并 器 和 虚拟 寄存 器 重 写 过 程 来 说 明 其 概念 。 图 6-6 说 明了 这 些 流程 是 如 何 相互 作 
用 的 。 





虚拟 寄存 器 


物理 寄存 器 





6.8.1 寄存 器 合并 器 


寄存 器 合并 器 通过 合并 代码 区 间 来 删除 多 余 的 复制 指令 (COPY)。 该 聚合 是 一 个 基于 目标 
机 器 函数 的 流程 ， 在 RegisterCoalescer 类 中 实现 (请 参阅 1ib/CodeGen/Register 
Coalescer .cpp)。 基 于 机 器 函数 的 流程 与 基于 每 个 函数 的 IR 流程 类 似 ， 但 后 者 采取 基 指 
令 的 格式 ， 而 前 者 采取 基于 机 器 指令 的 格式 。 在 聚合 过 程 中 ， 哺 数 joinAllIntervals() 
遍历 复制 指令 的 工作 列表 。 函 数 joinCopy ( ) 通过 复制 机 器 指令 创建 CoalescerPaiz 实 
例 ， 并 尽 可 能 地 合并 副本 。 

代码 区 间 由 对 应 开始 和 结束 的 一 对 程序 点 组 成 。 代 码 区 间 的 起 始点 对 应 一 条 定义 某 个 值 
的 指令 ， 并 一 直 持 续 到 另 一 条 指令 使 用 该 值 。 让 我 们 看 看 在 sum. bc 位 码 示例 中 运行 合并 
器 后 会 发 生 什 么 。 

我 们 使 用 11c 中 的 regalloc 调试 选项 来 检查 合并 器 的 调试 输出 : 

$ llc -march=sparc -debug-only=regalloc sum.bc 2>&1 | head -n30 

Computing live-in reg-units in ABI blocks. 

0B BB#0 IO#0 I1l#0 

实 实 突 家 实 风 内 灾 类 工 NTERVRILS 淡淡 灾 灾 炎 突 炎 内 家 央 

I0 [0B,32r:0) [112r,128r:1) 0@0B-phi 1@112r 

I1 [0B,16r:0) 0@0B-phi 

%vreg0 [32r,48r:0) 0@32r 

%vregl [16r,96r:0) 0@16r 

%vreg2 [80r,96r:0) 0@80r 

%vreg3 [96r,112r:0) 0@96r 

RegMasks: 
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突 窒 灾 突 内 家 内 内 闪 容 MACHINEINSTRS 交大 交 灾 风 容 内 容光 内 
# Machine code for function sum: Post SSA 
Frame Objects: 

fi#0: size=4, align=4, at location[SP] 

fi#1: size=4, align=4, at location[SP] 
Function Live Ins: $I0 in $vreg0, $Il in %vregl 


0B BB#0: derived from LLVM BB %entry 
Live Ins: %I0 %Il1 


16B %vregl<def> = COPY %Il<kill>; IntRegs:%vregl 
32B %vreg0<def> = COPY %IO0<kill>; IntRegs:%vreg0 
48B STri <fi#0>, 0, %vreg0<kill>; mem:ST4[%a.addr] 
IntRegs:%vreg0 

64B STri <fi#1>, 0, %vregl; mem:ST4[%b.addr] IntRegs:$vregl 
80B %vreg2<def> = LDri <fi#0>, 0; mem:LD4 [%a.addr] 
IntRegs:%vreg2 

96B %vreg3<def> = ADDrr %vreg2<kill>, %vregl<kill>; 
IntRegs:%vreg3,%vreg2,%vregl 

112B %I0<deft> = COPY %vreg3<kill>; IntRegs:%vreg3 
128B RETL 8, %I0<imp-use,kill> 


# End machine code for function sum. 


可 以 使 用 -debug-only 选项 为 特定 LLVM 流程 或 组 件 启用 内 部 调试 消息 。 若 
要 寻找 某 个 要 调试 的 组 件 ， 请 在 LLVM 源 文件 夹 中 运行 grep -r "DEBUG 
TYPE" *。DEBUG_TYPE 宏 定 义 了 可 以 激活 当前 文件 的 调试 消息 的 标志 选项 ， 
例如 ，#define DEBUG TYPE "regalloc" 被 用 在 实现 寄存 器 分 配 过 程 的 文 
件 中 as 


请 注意 ， 我 们 使 用 2>&l 将 用 于 打印 调试 信息 的 标准 错误 输出 重 定 向 到 标准 输出 。 之 
后 ， 我 们 将 标准 输出 〈 以 及 调试 信息 ) 定向 到 head -n30， 以 便 仅 打印 输出 的 前 30 行 。 因 为 
调试 信息 可 能 非常 元 长 ， 我 们 可 以 通过 这 种 方式 控制 终端 显示 的 信息 量 。 

我 们 首先 检查 ** MACHINEINSTRS *x 输出 ， 这 是 合并 器 流程 的 所 有 输入 机 器 指令 ， 
使 用 -print-machine-insts=phi-node-elimination 选 项 将 获得 同样 的 输出 ， 因 
为 该 选项 输出 所 有 在 phi 节点 消除 流程 (在 合并 器 之 前 执行 ) 后 的 机 器 指令 。 但 合并 器 的 调 
试 器 输出 为 每 个 机 器 指令 MI 增加 了 索引 信息 ， 例 如 0B、16B、32B 等 。 这 些 信息 可 以 帮助 
我 们 正确 识别 程序 区 间 。 

这 些 索引 也 被 称 为 插 槽 索引 ， 每 个 生存 周期 都 会 被 赋予 一 个 不 同 的 值 。 字 母 B 对 应 于 
块 ， 用 于 进入 /离开 基本 块 边界 的 生存 周期 。 示 例 中 的 指令 是 用 带 字 母 B 的 索引 打印 的 ， 因 
为 这 是 默认 的 位 置 。 区 间 中 的 男 外 一 个 位 置 ( 即 字母 r) 意味 着 寄存 器 ， 它 表示 一 个 正常 的 
寄存 器 使 用 /定义 位 置 。 

通过 阅读 机 器 指令 列表 ， 可 以 获知 分 配器 超 流程 《由 若干 个 小 流程 组 成 ) 的 重要 元 
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素 : $vreg0、%vregl1、%vreg2 和 %vreg3 都 是 需要 被 分 配给 物理 寄存 器 的 虚拟 寄存 器 。 
因此 ， 示 例 代码 中 除了 已 经 被 使 用 的 %I0 和 %I1 以 外 ， 最 多 将 再 使 用 4 个 物理 寄存 器 。 
ABI 调用 惯例 要 求 将 函数 参数 存储 在 这 些 已 经 使 用 的 寄存 器 中 。 此 外 活跃 变量 分 析 流 程 在 合 
并 器 之 前 运行 ， 因 此 代码 以 活跃 变量 信息 进行 标注 ， 以 显示 每 个 虚拟 寄存 器 在 哪些 点 被 定义 
和 结束 。 这 些 信息 可 以 帮助 合并 器 检测 不 同 虚 拟 寄 存 器 之 间 的 干扰 ， 即 检测 那些 同时 处 于 活 
跃 状态 并 且 需 要 放 在 不 同 物理 寄存 器 中 的 虚拟 寄存 器 。 

另 一 方面 ， 合 并 器 的 运行 算法 与 寄存 器 分 配 算法 的 结果 无 关 ， 因 为 它 只 是 寻找 寄存 器 副 
本 。 对 于 寄存 器 到 寄存 器 的 复制 指令 ， 合 并 器 会 将 源 寄 存 器 与 目标 寄存 器 的 生存 区 间 合 并 ， 
使 它们 位 于 同一 个 物理 寄存 器 中 ， 从 而 消除 原始 的 复制 操作 ， 比 如 示例 中 在 索引 16 和 32 位 
置 的 复制 操作 。 

*** INTERVALS *** 之 后 紧 跟 的 输出 来 自 合并 器 所 需 的 男 一 个 分 析 过 程 : 活跃 区 
间 分 析 (在 1ib/CcodeGen/LiveIntervalAnalysis.cpp 中 实现 ,与 活跃 变量 分 析 不 
同 )。 合 并 器 需要 知道 每 个 虚拟 寄存 器 的 的 活跃 区 间 ， 以 便 决 定 对 哪些 区 间 进 行 合并 。 例 如 ， 
可 以 从 示例 输出 中 看 到 虚拟 寄存 器 的 svreg0 活跃 区 间 是 [32r ,48r:0)。 

上 述 区 间 是 一 个 半 开 放 的 区 间 ， 其 中 svreg0 在 索引 32 处 定义 并 且 在 索引 48 处 终止 。 
48r 之 后 的 数字 0 是 用 于 标记 该 区 间 的 第 一 次 定义 位 置 的 代码 ， 其 含义 打印 在 区 间 之 后 : 
08@32r。 因 此 ， 这 表示 0 在 索引 32 处 被 定义 。 这 种 额外 信息 对 于 在 区 间 被 拆 分 后 追踪 其 原 
始 定义 非常 有 用 。 最 后 ，RegMasks 展示 包含 由 大 量 寄存 器 使 用 的 函数 调用 点 ， 这 也 是 很 
大 的 一 个 寄存 器 分 配 干 扰 源 。 由 于 示例 代码 中 不 包含 任何 函数 调用 ， 所 以 示例 输出 中 没有 
RegMask 位 置 。 

通过 观察 输出 的 区 间 ， 可 以 获取 以 下 信息 : sI0 寄存 器 的 活跃 区 间 是 [0B， 32r: 
0)，%vreg0 寄存 器 的 活跃 区 间 是 [32z,48r:0) ， 而 在 索引 32 有 一 条 复制 指令 将 %I0 复 
制 到 %vreg0。 根 据 这 些 先决 条 件 我 们 可 以 进行 寄存 器 合并 : 把 活跃 区 间 [32r， 48r:0) 
和 [0B,32r:0) 合并 ， 并 将 相同 的 寄存 器 分 配给 sI0 和 8%vreg0。 

现在 ， 让 我 们 打印 其 余 的 调试 输出 ， 看 看 发 生 了 什么 : 


$ llc -march=sparc -debug-only=regalloc sum.bc 


entry: 

16B %vregl<def> = COPY %Il; IntRegs:%vregl 
Considering merging %vregl with %Il 
Can only merge into reserved registers. 

32B %vreg0<def> = COPY %I0; IntRegs:%vreg0 
Considering merging %vreg0 with %I0 
Can only merge into reserved registers. 

64B %I0<def> = COPY %vreg2; IntRegs:%vreg2 
Considering merging %vreg2 with %I0 


Can only merge into reserved registers. 
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我 们 看 到 ， 如 同 刚刚 解释 的 那样 ， 合 并 器 考虑 将 svreg0 与 $10 结合 起 来 。 但 是 ， 当 
其 中 一 个 寄存 器 (8sI0 ) 是 一 个 物理 寄存 器 时 ， 它 运行 了 特殊 的 规则 。 涉 及 物理 寄存 器 的 合 
并 必须 保留 该 物理 寄存 器 ， 即 其 不 能 再 分 配给 其 他 活跃 区 间 。 但 示例 代码 并 未 保留 %8I0 寄 
存 器 ， 因 此 合并 器 放弃 了 合并 这 个 寄存 器 的 机 会 ， 因 为 过 早 将 $I0 分 配给 整个 区 间 可 能 对 
整个 程序 不 一 定 有 利 ， 合 并 器 将 最 后 的 决定 权 交 给 后 续 寄 存 器 分 配 阶 段 。 

因此 ，sum.bc 程序 中 没有 寄存 器 合并 的 机 会 。 尽 管 合 并 器 尝试 将 虚拟 寄存 器 与 函数 参 
数 寄存 器 合并 ,但 是 它 失败 了 ， 因 为 在 这 个 阶段 它 只 能 将 虚拟 寄存 器 与 保留 的 (而 不 是 常规 
可 分 配 的 ) 物理 寄存 器 合并 。 


6.8.2 ”虚拟 寄存 器 重 写 


寄存 器 分 配 流程 为 每 个 虚拟 寄存 器 选择 物理 寄存 器 。 之 后 ，VizrtRegMap 负责 保存 寄存 
器 分 配 的 结果 ， 因 此 它 包含 从 虚拟 寄存 器 到 物理 寄存 器 的 映射 。 接 下 来 ， 虚 拟 寄存 器 重 写 流 
程 (由 <1llvm source>/1ib/CodeGen/VirtRegMap.cpp 中 实现 的 VirtRegRewriter 
类 表示 ) 使 用 VirtRegMap 并 将 虚拟 寄存 器 引用 替换 为 物理 寄存 器 引用 ， 同 时 生成 相应 的 
溢出 代码 。 此 外 ，reg = COPY reg 的 剩余 自身 拷贝 也 被 删除 。 接 下 来 让 我 们 通过 例子 了 
解 分 配 阶 段 和 重 写 阶段 的 工作 流程 ， 我 们 使 用 -debug-only=regalloc 选项 处 理 sum. 
bc 文件。 首先， 基于 greedy 算法 的 寄存 器 分 配 程序 输出 以 下 文本 : 


assigning %vregl to %I1: I1 
assigning %vreg0 to %I0: I0 
assigning %vreg2 to %I0: I0 


虚拟 寄存 器 1、0 和 2 分 别 分 配给 物理 寄存 器 %Il1、%I0 和 %I0。 打 印 VirtRegMap 
的 内 容 将 获得 相同 的 输出 ， 如 下 所 示 : 


[%vreg0 -> %I0] IntRegs 
[%vregl -> %I1] IntRegs 
[%vreg2 -> %I0] IntRegs 


然后 ， 重 写 器 将 所 有 虚拟 寄存 器 替换 为 物理 寄存 器 并 删除 自身 拷贝 : 


> %Il<def> = COPY %Il1 
Deleting identity copy. 
> %I0<def> = COPY %I0 
Deleting identity copy-. 


可 以 看 到 ， 即 使 合并 器 无 法 删除 该 拷贝 ， 寄 存 器 分 配 程序 也 能 够 将 相同 的 寄存 器 分 配 到 
两 个 活路 区间 ， 并 删除 宛 余 的 拷贝 操作 。 最 后 ， 求 和 函数 对 应 的 机 器 指令 明显 减少 : 
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0B BB#0: derived from LLVM BB %entry 

Live Ins: %I0 %Il1 
48B %I0<def> = ADDrr %Il<kill>, %I0O<kill> 
80B RETL 8, %I0<imp-use> 


请 注意 ， 上 述 代 码 中 拷贝 指令 已 被 删除 ， 并 且 没 有 剩 下 虚拟 寄存 器 。 


KY llc 程 序 选 项 -debug 或 -debug-only=<name> 仅 在 LLVM 以 调试 模式 
:一 ( 在 配置 时 使 用 --disable-optimized) 编译 时 才 可 用 。 可 以 在 第 1 章 中 找 
到 有 关 这 方面 内 容 的 详细 信息 。 
寄存 器 分 配器 和 指令 调度 器 在 任何 编译 器 中 都 是 互相 对 立 的 。 寄 存 器 分 配器 
的 任务 是 尽 可 能 使 用 短 的 活跃 区 间 ， 减 轻 变 量 间 的 干扰 ， 从 而 减少 需要 的 寄存 器 
数量 和 溢出 代码 。 为 此 分 配器 倾向 于 以 串 行 方式 调度 指令 (将 有 依赖 关系 的 指令 
尽 可 能 放 在 一 起 )， 因 为 这 样 可 以 减少 代码 的 寄存 器 使 用 数量 。 而 调度 器 的 任务 
刚好 相反 : 为 了 提高 指令 级 并 行 度 ， 它 需要 保持 尽 可 能 多 的 不 相关 指令 ， 这 会 使 
用 更 多 寄存 器 来 保存 中 间 值 ， 并 增加 活跃 区 间 之 间 的 干扰 数量 。 设 计 有 效 的 算法 
来 协调 指令 调度 和 寄存 器 分 配 仍 是 一 个 开放 的 研究 问题 。 


6.8.3 编译 目标 的 信息 


在 合并 期 间 ， 来 自 兼容 的 寄存 器 类 的 虚拟 寄存 器 才能 被 成 功 合 并 。 代 码 生 成 器 从 通过 抽 
象 方法 获取 的 特定 于 目标 的 描述 中 获得 这 类 信息 。 分 配器 可 以 在 TargetRegisterInfo 
的 子 类 (例如 X86GenRegisterInfo) 中 获取 有 关 某 个 寄存 器 的 所 有 信息 ， 这 些 信息 包括 
它 是 否 为 保留 寄存 器 、 它 的 父 寄 存 器 类 以 及 它 是 物理 的 还 是 虚拟 的 寄存 器 。 

<Target>InstrInfo 类 是 另 一 种 数据 结构 ， 它 提供 寄存 器 分 配 所 需 的 特定 于 目标 的 
信息 ， 下 面 是 一 些 例 子 : 

e 在 溢出 代码 生成 过 程 中 , 使 用 <Target>InstrInfo 中 的 isLoadFromStackSslot() 
和 isStoreToStackS1lot() 函数 可 以 发 现 机 器 指令 是 否 访问 堆栈 内 存 。 
溢出 代码 生成 程序 还 使 用 storeRegToStackSlot() 和 loadRegFromStackSlot() 
函数 生成 特定 于 目标 的 内 存 访问 指令 以 访问 堆栈 。 
COPY 指令 可 能 保留 在 重 写 程序 之 后 ， 因 为 非 自 身 拷贝 的 COPY 指令 可 能 无 法 被 合 
并 。 在 这 种 情况 下 ，copyPhysReg() 方法 用 于 在 必要 时 生成 特定 于 目标 的 寄存 器 
副本 ， 即 使 在 不 同 的 寄存 器 类 中 也 是 如 此 。SparcInstrInfo: :copyPhysReg() 
的 一 个 例子 如 下 : 


if (SP::IntRegsRegClass.contains (DestReg, SrcReg)) 
BuildMI (MBB, I, DL, get (SP::ORrr), DestReg) .addReg (SP: :G0) 
.addReg (SrcReg, getrillRegState (Killsrc)); 


BuildMI( ) 方法 可 用 于 生成 机 器 指令 ， 它 在 代码 生成 器 的 所 有 部 分 都 被 使 用 。 在 本 
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例 中 ，SP: :ORrr 指令 用 于 将 一 个 寄存 器 内 容 复制 到 另 一 个 寄存 器 。 


6.9 前 序 代码 和 结束 代码 


完整 的 函数 包括 前 序 代 码 和 结束 代码 。 前 者 在 函数 开始 时 设置 堆栈 帧 和 被 调用 者 保存 的 
寄存 器 ， 而 后 者 在 函数 返回 之 前 清除 堆栈 帧 。 在 示例 代码 sum.bc 中 ， 下 面 是 为 SPARC 编 
译 目 标 加 入 前 序 代 码 和 结束 代码 之 后 的 机 器 指令 : 

%O6<def> = SAVEri %06, -96 

%I0<def> = ADDrr %Il<kill>, %I0<kill> 


%GO<def> = RESTORErr %G0, %GO0 
RETL 8, %I0<imp-use> 


在 这 个 例子 中 ,SAVEri 指令 为 前 序 代码 ,RESTORErr 是 结束 代码 ， 二 者 负责 堆栈 帧 相关 
的 设置 和 清理 。 前 序 和 结束 代码 的 生成 取决 于 编译 目标 , 在 <Target>FrameLowering:: 
emitPrologue() 和 <Target>FrameLowering::emitEpilogue() 困 数 中 定义 (请 
参阅 文件 <llvm_source>/lib/Target/<Target>/<Target> FrameLowering. 
cCBD)。 


帧 索引 


LLVM 在 代码 生成 期 间 使 用 虚拟 堆栈 帧 ， 并 且 使 用 帧 索引 来 引用 堆栈 元 素 。 负 责 加 入 前 
序 代 码 的 程序 也 进行 堆栈 帧 分 配 ， 并 向 代码 生成 器 提供 足够 的 目标 特定 信息 ， 以 便 将 虚拟 帧 
索引 替换 为 实际 〈 目 标 特定 的 ) 堆栈 引用 。 

<Target>RegisterInfo 类 中 的 eliminateFrameIndex() 函数 实现 了 上 述 替换 
功能 ， 它 可 以 将 所 有 包含 堆栈 访问 的 机 器 指令 (通常 是 加 载 和 存储 ) 中 的 帧 索引 替换 为 实际 
的 堆栈 偏 移 量 。 该 过 程 可 能 生成 额外 的 指令 ， 以 处 理 额 外 的 堆栈 偏 移 计算 。 请 参阅 <11vm_ 
source>/1lib/Target/<Target>/<Target>RegisterInfo.cpp 文件 获取 更 多 
示例 。 


6.10 ”机 器 代码 框架 介绍 

机 器 代码 (简称 MC) 类 包含 一 个 用 于 对 函数 和 指令 进行 低层 操作 的 完整 框架 。 这 是 一 
个 与 其 他 后 端 组 件 不 同 的 新 框架 ， 其 目的 在 于 帮助 创建 基于 LLVM 的 汇编 器 和 反 汇 编 回 。 
在 此 之 前 ，LLVM 缺少 集成 汇编 器 ， 只 能 完成 汇编 语言 输出 之 前 的 编译 步 又， 该 步 又 只 能 输 
出 一 个 汇编 文本 文件 ， 需 要 依靠 外 部 工具 来 执行 其 余 的 编译 过 程 〔 即 汇编 器 和 链接 器 )。 


6.10.1 MC 指令 


在 MC 框架 中 ， 机 器 代码 指令 (McInst) 取代 了 机 器 指令 (MachineInstr)。 定 义 
在 <llvm source>/include/1llvm/MC/MCInst.h 文件 中 的 McInst 类 提供 了 更 为 轻 
量 级 的 指令 表示 格式 。 与 MI 相 比 ，MCInst 携带 的 程序 信息 较 少 。 例 如 ，MCInst 的 实例 
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不 仅 可 以 由 后 端 创建 ， 也 可 以 从 几乎 没有 上 下 文 信息 的 二 进 制 代 码 经 由 反 汇 编 器 创建 。 事 实 
上 ， 这 也 反应 了 汇编 器 与 编译 器 的 不 同 之 处 : 其 目标 不 在 于 代码 优化 ， 而 是 仅仅 负责 按照 目 
标 文 件 的 格式 组 织 指令 。 

MCInst 指令 的 操作 数 可 以 是 寄存 器 、 立 即 数 (整数 或 浮 点 数 )、 表 达 式 (由 MCExpr 表 
示 ) 或 其 他 McInstr 实例 。 表 达 式 用 来 表示 带 标签 的 计算 和 重 定位 。MI 指令 在 代码 输出 的 
早期 阶段 被 转换 为 McInst 实例 ， 这 是 下 一 小 节 的 主题 。 


6.10.2 ”代码 输出 


代码 输出 阶段 发 生 在 执行 完 所 有 寄存 器 分 配 流程 以 后 。 虽 然 命名 可 能 看 起 来 令 人 困 
惑 ， 但 代码 输出 从 汇编 打印 机 (AsmPrinter) 流程 (pass) 开始 。 图 6-7 显示 从 MI 指令 到 
MCInst， 然 后 到 汇编 或 二 进 制 指令 的 所 有 步骤 。 


MCStreamer 
‘ \ 





/ 、 (5) 
MCAsmSteamer MCObjectSteamer LARI 
1 
1 SS 
MCELFStreamer MCCOFFStreamer 
\ 

\ 
、 





接 下 来 我 们 逐一 讲解 图 6-7 中 的 步骤 : 

1. AsmPrinter 是 一 个 机 器 函数 流程 ， 它 首先 输出 函数 前 序 部 分 ， 然 后 遍历 所 有 基本 
块 ， 并 调用 EmitInstruction() 函数 逐条 处 理 每 个 基本 块 中 的 MI 指令 。 每 个 编译 目标 
负责 提供 一 个 重 载 此 函数 的 AsmPrinter 子 类 。 

2. <Target>Asmprinter::EmitInstruction() 函数 接收 MI 指令 作为 输入 ， 并 
通过 MCInstLowering 接口 将 其 转换 为 McInst 实例 ， 在 此 过 程 中 ， 每 个 编译 目标 负责 
提供 一 个 该 接口 的 子 类 ， 并 且 有 能 生成 这 些 MCInst 实例 的 自 定义 代码 。 

3. 此 时 有 两 个 进一步 处 理 选 项 : 输出 汇编 指令 或 二 进 制 指令 。MCStreamer 类 处 理 一 
系列 MCInst 指令 ， 并 通过 两 个 子 类 MCAsmstreamer 和 MCObjectStreamer 将 它们 输 
出 到 指定 目标 。 前 者 输出 为 汇编 语言 ， 后 者 输出 为 二 进 制 指令 。 

4. 如 果 生 成 汇编 指令 ， 则 需 调 用 MCAsmstreamer: :EmitInstruction( )， 并 使 用 


特定 于 目标 的 MCInstPrinter 子 类 将 汇编 指令 打印 到 文件 。 

5. 如 果 生 成 二 进 制 指令 ， 则 一 个 特定 于 目标 和 对 象 的 专门 的 MCObjectStreamer: :也 
mitInstructions() 版 本 将 会 调用 目标 代码 的 汇编 器 。 

6. 汇编 器 使 用 专门 的 MCCodeEmitter: :EncodeInstruction( ) 方法 ， 该 方法 能 够 
以 特定 于 编译 目标 的 方式 对 二 进 制 指令 大 对 象 进行 编码 并 将 其 输出 到 文件 (与 MCInst 实例 
不 同 )。 

也 可 以 使 用 11c 工具 打印 MCInst 代码 段 。 例 如 ， 使 用 以 下 命令 可 以 将 MCInst 输出 到 
汇编 注释 中 : 


$ llc sum.bc -march=x86-64 -show-mc-inst -o - 


pushq %rbp ## <MCInst #2114 PUSH64r 
## <MCOperand Reg:107>> 


但 如 果 想 要 在 汇编 注释 中 显示 每 条 指令 的 二 进 制 编码 ， 请 用 以 下 命令 : 


$ llc sum.bc -march=x86-64 -show-mc-encoding -Oo - 


pushq %rbp ## encoding: [0x55] 


llvm-mc 工具 还 允许 测试 和 使 用 MC 框架 。 例如， 要 打印 特定 指令 的 汇编 器 编码 ， 请 
使 用 --show-encoding 选项 。 以 下 是 一 个 x86 指令 的 例子 : 


$ echo "movq 48879(,%riz), %rax" | llvm-mc -triple=x86 64 --show-encoding 
# encoding: [0x48,0x8b,0x04,0x25,0xef,Oxbe,O0x00,0x00] 


该 工具 同时 提供 反 汇 编 功能 ， 如 下 所 示 : 


$ echo "0x8d Ox4c 0x24 0x04" | llvm-mc --disassemble -triple=x86 64 
leal 4(%rsp), %ecx 


此 外 ，--show-inst 选项 可 以 显示 反 汇 编 或 汇编 指令 的 McInst 实例 : 
$ echo "0x8d Ox4c Ox24 0x04" | llvm-mc --disassemble -show-inst 
-triple=x86 64 
leal 4(%rsp), %ecx # <MCInst #1105 LEA64 32r 

# <MCOperand Reg:46> 
<MCOperand Reg:115> 
<MCOperand Imm:1> 
<MCOperand Reg:0> 
<MCOperand Imm:4> 
<MCOperand Reg:0>> 


MC 框架 允许 LLVM 提供 有 别 于 传统 文件 读 取 程 序 的 其 他 工具 。 例 如 ， 目 前 LLVM 默 
认 构 建 会 安装 11vm-objdump 和 11vm-readobj 工具 。 两 者 都 使 用 MC 反 汇 编 器 库 ， 并 
实现 了 与 GNU Binutils 包 中 类 似 的 功能 (objdump 和 readelf )。 


闪 章 非 着 非 
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6.11 ” 自 定 义 机 器 流程 


在 本 节 中 ， 我 们 将 介绍 如 何 编写 一 个 自 定义 的 机 器 指令 流程 (pass)， 以 计算 在 代码 输出 
之 前 每 个 函数 有 多 少 机 器 指令 。 与 IR 流程 不 同 ， 你 不 能 使 用 opt 工具 来 运行 此 流程 ， 也 不 
能 通过 命令 行 加 载 和 执行 该 流程 。 机 器 流程 由 后 端 代码 决定 。 因 此 ， 我 们 将 修改 现 有 的 后 
端 ， 通 过 运行 自 定义 好 的 流程 来 实践 性 地 观察 和 学 习 。 我 们 将 选取 SPARC 作为 编译 目标 。 

回想 一 下 第 3 章 中 的 展示 可 插入 流程 接口 部 分 ， 以 及 本 章 第 一 幅 示 例 图 中 的 白色 方 
块 ， 我 们 有 很 多 可 以 选择 的 位 置 以 运行 我 们 的 示例 流程 。 要 使 用 这 些 方法 ,我们 应 该 查找 
我 们 的 后 端 所 实现 的 TargetPassConfig 子 类 。 如 果 使 用 grep, 可 以 在 sparcTarget 
Machine .cpp 中 找到 它 : 


$ cd <llvmsource>/lib/Target/Sparc 


$ vim SparcTargetMachine.cpp # use your preferred editor 


查看 派生 自 TargetPassConfig 的 SparcPassConfig 类 ， 可 以 看 到 它 重 写 了 addInst 
Selector() 和 addPreEmitPass(), 但 是 可 以 通过 重 写 许多 其 他 方法 在 其 他 相应 位 置 
添加 一 个 流程 (参见 链接 http://llvm.org/doxygen/html/classllvm 1 lTarget 
PassConfig .html)。 我 们 将 在 代码 输出 前 执行 该 流程 ， 为 此 我 们 在 addPreEmitPass() 
中 添加 如 下 代码 : 


bool SparcPpassConfig::addPreEmitpass() { 
addPass (createSparcDelaySlotFillerPass (getSparcTargetMachine())); 
addPass (createMyCustomMachinePass()); 


} 


额外 添加 的 代码 被 加 粗 显示 ， 它 通过 调用 createMyCustomMachinePass() 函数 来 
加 入 我 们 的 流程 ， 但 该 函数 还 未 被 定义 。 我 们 将 添加 一 个 包含 此 流程 代码 的 新 文件 ， 并 在 其 
中 定义 上 述 函 数 。 为 此 ， 我 们 创建 一 个 名 为 MachineCountPass .cpp 的 新 文件 ， 并 向 其 
填 入 以 下 内 容 : 


#define DEBUG TYPE "machinecount" 

#include "Sparc.h" 

#include "llvm/Pass.h'" 

#include "llvm/CodeGen/MachineBasicBlock.h" 
#include "llvm/CodeGen/MachineFunction.h" 
#include "llvm/CodeGen/MachineFunctionpass.h" 
#include "llvm/Support/raw ostream.h" 

using namespace llvm; 


namespace { 
class MachineCountPass : public MachineFunctionPass { 
public: 

static char ID; 

MachineCountPass() : MachineFunctionpass (ID) {} 


virtual bool runonMachineFunction(MachineFunction &MF) { 
unsigned num instr = 0; 
for (MachineFunction::const iterator I = MF.begin(), E = MF.end(); 


I != E; ++I) { 
for (MachineBasicBlock::const iterator BBI = I->begin(), 
BBE = I->end(); BBI != BBE; ++BBI) { 


++num instr; 


errB() < mcounEt === " &< ME.getName() << " has 
<< num instr << " instructions.\n'"; 
return false; 


FunctionPass *llvm::createMyCustomMachinepass() { 
return new MachineCountPass () ; 


} 


char MachineCountPass::ID = 0; 
static RegisterPass<MachineCountPass> X("machinecount", "Machine Count 
Pass"); 


第 一 行 定义 宏 DEBUG_TYPE， 以 便 通过 -debug-only=machinecount 标志 调试 流 
程 ， 但 此 示例 中 并 不 涉及 调试 输出 的 使 用 。 其 余 代码 与 在 之 前 章节 中 为 IR 流程 所 写 的 代码 
非常 相似 。 主 要 有 以 下 区 别 : 
e 在 头 文件 中 ， 引 入 了 MachineBasicBlock.h、MachineFunction.h 和 Machine 
FunctionPass.h 头 文件 ,用 于 定义 用 来 提取 MachineFunction 相关 信息 的 
类 ， 并 允许 我 们 计算 其 中 机 器 指令 的 数量 。 我 们 还 使 用 了 Sparc .h 头 文件 ， 因 为 我 
们 将 在 其 中 声明 createMyCustomMachinePass()。 
e 创建 一 个 从 MachineFunctionPass 而 不 是 FunctionPass 派生 的 类 。 
e 重 写 runOnMachineFunction() 图 数 ， 而 不 是 runonFunction() 函数 ， 而 
且 该 函数 的 实现 是 完全 不 同 的 。 我 们 遍历 当前 MachineFunction 中 的 所 有 
MachineBasicBlock 实例 。 然 后 ， 对 于 每 个 MachineBasicBlock， 也 通过 使 
用 begin()/end() 用 法 来 计算 它 的 所 有 机 器 指令 数 。 
e@ 定义 函数 createMyCustomMachinePass()， 以 便 在 修改 后 的 SPARC 后 端 文件 
中 创建 和 添加 代码 输出 之 前 的 流程 。 
由 于 我 们 已 经 定义 了 createMyCustomMachinePass() 困 数 ， 所 以 必须 在 头 文件 中 
声明 它 。 为 此 我 们 在 Sparc.h 文件 中 createSparcDelaySlLotFillerPass() 的 旁边 
添加 如 下 声明 : 


FunctionPass *createSparcISelDag (SparcTargetMachine &TM) ; 
FunctionPass *createSparcDelaySlotFillerPpass (TargetMachiine &TM) ; 
FunctionPass *createMyCustomMachinePass(); 


现在 我 们 可 以 用 LLYM 构建 系统 构建 新 的 SPARC 后 端 ， 关 于 LLVM 的 配置 信息 请 参阅 
第 1 章 。 
如 果 已 经 有 了 一 个 用 于 构建 项 目的 文件 夹 ， 请 转 到 此 文件 夹 并 运行 make 以 编译 新 的 后 
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端 。 之后， 可 以 安装 这 个 修改 了 SPARC 后 端的 LLVM 版 本 ,或 者 直接 在 构建 文件 夹 中 运行 
新 的 11c 程序 ， 而 无 须 运行 make install 命令 : 

$ cd <llvm-build> 

$ make 


$ Debug+Asserts/bin/llc -march=sparc sum.bc 


mcount --- sum has 8 instructions. 


可 以 使 用 以 下 命令 查看 我 们 的 流程 被 加 入 流程 通道 的 什么 位 置 : 


$ Debug+Asserts/bin/llc -march=sparc sum.bc -debug-pass=Structure 
| 

Branch Probability Basic Block Placement 

SPARC Delay Slot Filler 

Machine Count Pass 

MachineDominator Tree Construction 

Machine Natural Loop Construction 

Sparc Assembly Printer 


mcount --- sum has 8 instructions. 


可 以 看 到 ， 我们 的 流程 位 于 “ SPARC Delay Slot Filler” 之 后 并 且 在 发 生 代码 
输出 的 “sparc Assembly Printer” 之 前 。 


6.12 总结 


在 本 章 中 , 我 们 简要 介绍 了 LLVM 后 端的 工作 原理 。 我 们 讨论 了 在 编译 期 间 不 同 的 代 
码 生 成 器 阶段 和 在 不 同 阶段 发 生变 化 的 内 部 指令 表示 形式 ， 还 讨论 了 指令 选择 、 调 度 、 寄 
存 器 分 配 、 代 码 输 出 ， 并 向 读者 展示 了 使 用 LLVM 工具 体验 这 些 过 程 的 方法 。 在 本 章 的 最 
后 ， 读 者 应 该 能 够 读 懂 11c -debug 命令 的 输出 结果 (该 命令 打印 后 端 活动 的 详细 日 志 )， 
并 且 知 道 后 端 内 部 发 生 的 所 有 过 程 。 如 果 有 兴趣 建立 自己 的 后 端 ， 下 一 步 可 以 参考 官方 教程 
http://llvm.org/docs/WritingAnLLVBackend.html。 如 果 有 兴趣 阅读 更 多 关于 
后 端 设计 的 信息 ， 请 参阅 http://llvm.org/docs/CodeGenerator.html。 

在 下 一 章 中 ,我 们 将 介绍 LLVM 即时 编译 框架 ， 它 可 以 按 需 生成 代码 。 
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Getting Started with LLVM Core Libraries 


印 时 编 详 硕 





LLVM 即时 (Just-In-Time, JIT) 编译 器 是 一 个 基于 函数 的 动态 翻译 引擎 。 让 我 们 参考 原 
始 术 语 来 理解 什么 是 JIT 编译 器 。JIT 这 个 术语 来 自 即 时 制造 ， 是 一 种 工厂 根据 需求 制造 或 
购买 原材料 ， 而 不 依赖 于 库存 (认为 库存 是 资源 浪费 ) 的 商业 战略 。JIT 编译 器 借用 了 这 个 
含义 ， 它 不 将 二 进 制 文件 存储 在 磁盘 (库存) 中 ， 而 是 在 运行 时 才 根 据 需 求 来 编译 程序 部 件 。 
JIT 编译 器 有 时 也 称 为 延迟 编译 或 惰性 编译 。 

JIT 策略 的 优势 来 自 精 确 感知 程序 运行 时 的 计算 机 微 体 系 结构 ， 这 使 得 JIT 编译 器 可 
以 根据 这 些 特定 信息 对 代码 进行 优化 。 此 外 ， 有 些 编 译 器 只 能 在 运行 时 才能 知道 它们 的 输 
和信， 这 种 情况 下 只 能 应 用 JIT 系统 。 例 如 ，GPU 驱动 程序 对 着 色 语 言 进行 即时 编译 、 使 用 
JavaScript 的 Internet 浏览 器 等 。 在 本 章 中 ,我们 将 探讨 LLVM JIT 系统 ， 并 涵盖 以 下 主题 : 

e llvm: :JIT 类 及 其 基础 结构 

e 如 何 使 用 11vm: :JIT 类 进行 JIT 编译 

e 如 何 使 用 GenericValue 来 简化 函数 调用 

e 11vm::MCJIT 类 及 其 基础 结构 

e 如 何 使 用 11vm: :MCJIT 类 进行 JIT 编译 


7.1 LLVM JIT 引擎 的 基础 知识 介绍 


LLVM JIT 编译 句 是 基于 函数 的 ， 因 为 它 每 次 编译 一 个 函数 。 这 定义 了 编译 融 工 作 的 粒 
度 ， 也 是 JIT 系统 的 一 个 重要 特性 。 通 过 按 需 编译 函数 ， 系 统 只 需 处 理 该 程序 调用 中 实际 使 
用 的 函数 。 例 如 ， 如 果 一 个 程序 有 若干 个 函数 ， 但 是 在 启动 时 提供 了 错误 的 命令 行 参数 ， 那 
么 ， 基于 函数 的 JIT 系统 将 只 编译 打印 帮助 信息 的 函数 ， 而 不 编译 整个 程序 。 


从 理论 上 讲 ， 我 们 可 以 进一步 优化 JIT 系统 的 编译 粒度 ， 例 如 只 编译 函数 具体 路 
径 的 轨迹 。 这 样 的 做 法 充分 利用 了 JIT 系统 的 优势 : 它 能 够 判断 在 给 定 的 输入 下 
哪些 程序 路 径 比 其 他 路 径 更 值得 去 编译 。LLVM JIT 系统 并 不 支持 基于 路 径 的 编 
译 ， 但 这 个 方向 在 研究 中 受到 越 来 越 多 的 关注 。JIT 编译 是 无 休止 讨论 的 主题 ， 
需要 仔细 研究 大 量 不 同 的 权衡 关系 ， 而 且 很 多 情况 下 找到 最 优 策略 是 非常 困难 
的 。 目 前 ,计算机 科学 界 已 经 积累 了 大 约 20 年 的 JIT 编译 研究 经 验 ， 每 年 都 有 
新 的 论文 涌现 ， 试 图 解决 这 个 问题 。 


JIT 引 警 的 工作 是 在 运行 时 编译 和 执行 LLVM IR 函数 。 在 编译 阶段 ，JIT 引擎 将 通过 
LLVM 代码 生成 器 使 用 特定 于 目标 的 二 进 制 指令 生成 二 进 制 大 对 象 。 然 后 ，JIT 引擎 返回 指 


匈 肝 编 奉 吉 123 


向 已 编译 函数 的 指针 ， 系 统 可 以 通过 该 指针 执行 原 函 数 。 


-ML 、 你 可 以 阅读 一 篇 有 趣 的 博客 文章 http://eli.thegreenplace.net/2014/ 

Q 01/15/some-thoughts-on-llvm-vs-libjit， 它 比较 了 JIT 编 译 的 各 种 
开源 解决 方案 ， 其 中 分 析 了 LLVM 和 libjit， 后 者 是 针对 JIT 编译 的 一 个 较 小 的 
开源 项 目 。 相 比 于 JIT 系统 ，LLVM 通常 被 认为 是 一 种 静态 编译 器 。 因 为 对 于 
JIT 编译 来 说 ， 在 每 个 流程 (pass) 中 花费 的 时 间 成 本 是 很 高 的 ， 这 被 视 为 程序 的 
执行 开销 。 但是， 目前 LLVM 基础 架构 更 加 强调 支持 相对 较 慢 而 强大 的 GCC 优 
化 ， 而 不 是 快速 而 普通 的 优化 ， 而 后 者 对 于 构建 一 个 有 竞争 力 的 JIT 系统 非常 重 
要 。 尽 管 如 此 ， 目 前 还 是 有 一 些 基于 LLVM JIT 系统 的 成 功 案例 ， 包 括 Webkit 
JavaScript 引 学 的 Fourth Tier LLVM (FTL) 组 件 ( 具 体 参 见 http://blog. 
llvm.org/2014/07/ftl-webkits-llvm-based-jit.html)。 由 于 该 组 
件 仅 用 于 运行 时 间 较 长 的 JavaScript 应 用 程序 ， 即 使 其 优化 速度 不 比 其 他 方案 更 
快 ，LLVM 依然 可 以 发 挥 比较 好 的 效果 。 原 因 是 运行 时 间 长 的 应 用 程序 可 以 允 
许 花费 更 多 的 时 间 在 昂贵 的 优化 上 。 要 了 解 更 多 关于 这 种 权衡 关系 的 知识 ， 请 查 
看 IISWC 2013 上 由 César 等 人 发 表 的 《 Modeling Virtual Machines Misprediction 
Overhead 》， 该 工作 主要 研究 在 JIT 系统 中 错误 地 使 用 低 效 代码 生成 器 所 造成 的 性 
能 损失 。 当 一 个 JIT 系统 浪费 大 量 时 间 来 优化 只 执行 几 次 的 程序 片段 时 ， 就 会 发 
生 这 种 情况 。 


7.1.1 介绍 执行 引擎 
LLVM JIT 系统 包含 一 个 执行 引擎 以 支持 LLVM 模块 的 执行 。 在 <11vm_source>/ 


include/llvm/ExecutionEngine/ExecutionEngine.h 中 声明 的 ExecutionEngine 
类 用 于 支持 JIT 系统 或 解释 器 的 执行 (参见 下 面 的 信息 框 )。 通 常 ， 执 行 引 擎 负责 管理 整个 
客户 程序 的 执行 ， 分 析 需 要 运行 的 下 一 个 程序 片段 ， 并 采取 适当 的 方式 来 执行 该 片段 。 执 行 
JIT 编译 时 ， 必 须 使 用 执行 管理 器 协调 编译 过 程 和 运行 客户 程序 (一 次 一 个 片段 )。LLVM 的 
ExecutionEngine 类 可 以 运行 编译 管道 并 生成 存在 于 内 存 中 的 代码 ,， 但是， 是否 执行 这 
个 代码 取决 于 用 户 。 

除了 存储 要 执行 的 LLVM 模块 以 外 ， 该 引擎 还 支持 以 下 几 种 情况 : 

e 惰性 编译 : 引擎 只 在 函数 被 调用 时 才 编 译 该 函数 。 如 果 禁 用 惰性 编译 ， 执 行 引擎 会 

在 你 请 求 其 指针 时 立即 编译 函数 。 
e 编译 外 部 全 局 变量 : 这 包括 对 在 当前 LLVM 模块 范围 外 的 实体 进行 符号 解析 和 内 存 


分 配 。 
。 通过 dlsym 查找 和 解析 外 部 符号 : 这 与 在 运行 时 进行 动态 共享 对 象 ( DSO) 加 载 所 
使 用 的 过 程 相同 。 


LLVM 中 有 两 个 JIT 执行 引擎 的 实现 : 11vm: :JIT 类 和 11lvm: :MCJIT 类 。 可 以 通过 
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调用 ExecutionEngine::EngineBuilder() 方 法， 并 传递 一 个 IR Module 对 象 作 为 
参数 ， 来 实例 化 ExecutionEngine 对 象 。 接 下 来 , ExecutionEngine::create() 
方法 会 创建 一 个 JIT 或 McCJIT 引擎 实例 ， 这 二 者 的 实现 有 着 显著 的 不 同 ， 在 本 章 中 将 会 清 
楚 地 说 明 这 一 点 。 


& 解释 器 为 执行 硬件 平台 (主机 平台 ) 本 身 不 支持 的 客户 代码 提供 了 一 种 替代 执行 
= 策略。 例如 ， 由 于 X86 处 理 器 不 能 直接 执行 LLVM IR， 所 以 LLVM IR 可 以 被 认 
为 是 x86 平台 上 的 客户 代码 。 与 JIT 编译 不 同 ， 解 释 器 的 任务 是 读 取 单个 指令 、 
对 其 解码 并 执行 ， 还 要 在 软件 中 模仿 实际 处 理 器 的 功能 。 即 使 解释 器 没有 将 时 间 
浪费 在 编译 客户 代码 上 ， 解 释 器 通常 也 要 慢 得 多 ， 除 非 编译 客户 代码 所 需 的 时 间 

能 抵消 解释 代码 的 高 昂 开 销 。 


7.1.2 内存 管 理 


JIT 引 擎 通常 使 用 BEBxecutionManager 类 把 编译 好 的 二 进 制 指令 大 对 象 写 入内 
存 。 之 后 ， 程 序 可 以 跳 转 到 已 分 配 的 内 存 区 域 来 执行 这 些 指令 ， 该 跳 转 过 程 需 要 调用 
ExecutionManager 返回 的 函数 指针 。 因 此 ，JIT 引擎 中 的 内 存 管 理 非 常 重要 ， 特 别 是 对 于 
执行 诸如 内 存 分 配 、 内 存 回收 、 为 加 载 库 提供 空间 以 及 内 存 访问 许可 处 理 等 常见 任务 而 言 。 

JIT 和 MCJIT 类 都 实现 了 从 RTDyldMemoryManager 基 类 派生 的 自 定义 内 存 管 理 
类 。 任何 ExecutionEngine 客户 端 还 可 以 提供 一 个 自 定 义 的 RTDyldMemoryManager 
子 类 来 指定 不 同 的 JIT 组 件 在 内 存 中 的 放置 位 置 。 可 以 在 <llvm_source>/include/ 
llvm/ExecutionEngine/RTDyldMemoryManager.h 文件 中 找到 此 接口 。 

例如 ，RTDyldMemoryManager 类 声明 了 以 下 方法 : 


e allocatecodeSection() 和 allocateDataSection() : 这 些 方法 以 给 定 大 
小 和 对 齐 方式 来 为 可 执行 代码 和 数据 分 配 内 存 。 内 存 管理 客户 端 可 以 使 用 内 部 标识 
符 参 数 来 跟踪 已 分 配 的 内 存 段 。 


e getSymbolAddress(): 该 方法 返回 当前 链接 库 中 可 用 符号 的 地 址 。 请 注 
意 ， 该 方法 不 用 来 获取 JIT 编译 所 生成 的 符号 。 你 必须 提供 一 个 包含 符号 名 称 的 
std: :string 实例 才能 使 用 此 方法 。 

e finalizeMemory() : 该 方法 应 该 在 对 象 加 载 完成 和 内 存 的 权限 设置 好 之 后 调用 。 
例如 ， 在 调用 此 方法 之 前 ， 无 法 运行 生成 的 代码 。 该 方法 将 转向 MCJIT 客户 端 而 不 
是 JIT 客户 端 ， 本 章 后 面 将 进一步 解释 。 

JITMemoryManager 和 SectionMemoryManager 分别 是 JIT 和 MCJIT 的 默认 子 

类 ， 然 而 客户 端 可 以 提供 自 定义 的 内 存 管理 实现 。 


7.2 lIvm::JIT 框架 介绍 
JI 类 及 其 框架 代表 旧版 引擎 ， 并 且 它 是 通过 使 用 LLVM- 代 码 生 成 器 的 不 同 部 分 实现 
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的 。 在 LLVM 3.5 版 本 后 ， 它 将 会 被 移 除 。 即 使 该 引擎 基本 上 是 目标 独立 的 ， 每 个 编译 目标 
也 都 必须 为 其 特定 的 指令 实现 二 进 制 指令 输出 步骤 。 


7.2.1 将 二 进 制 大 对 象 写 入 内 存 


JIT 类 使 用 JITCodeEmitter (MachineCodeEmitter 的 子 类 ) 输出 二 进 制 指令 。 
MachineCodeEmitter 类 用 于 输出 与 新 的 机 器 码 (Machine Code，MC) 框架 无 关 的 机 器 
码 ， 尽 管 它 即将 过 时 ，JIT 类 目前 仍 需 使 用 其 功能 。 使 用 该 框架 的 局 限 性 在 于 仅 支 持 少数 目 
标 ， 而 且 并 非 所 有 目标 特性 都 可 用 。 

MachineCodeEmitter 类 的 方法 支持 以 下 任务 : 

e 为 当前 需要 编译 的 函数 分 配 空间 (allocateSpace() )。 

e 将 二 进 制 大 对 象 写 人 内 存 缓冲 区 (emitByte( ) .emitWordLE( ) .emitNordBE()、 

emitAlignment() 等 )。 

e 跟踪 当前 的 缓冲 区 地 址 ( 即 指向 将 输出 下 一 条 指令 的 地 址 的 指针 )。 

e 在 此 缓冲 区 中 添加 相对 于 指令 地 址 的 重 定 位 信息 。 

将 字 节 写 入 内 存 的 任务 由 JITCodeEmitter 类 完成 , 它 是 代码 输出 过 程 中 涉 
及 的 另 一 个 类 。 该 类 是 一 个 JITCodeEmitter 子 类 ， 实 现 了 特定 的 JIT 功 能 。 虽 然 
JITCodeEmitte 非常 简单 ， 只 能 将 字 节 写 人 缓冲 区 , 但 JITEmittez 类 具有 以 下 改进 : 

e 先前 提 到 的 专用 内 存 管理 器 JIITMemoryManager (也 是 下 一 节 的 主题 )。 

e 一 个 解析 器 (JITResolver) 实例 ,用 于 跟踪 并 解析 尚未 编译 函数 的 调用 。 它 对 于 

惰性 函数 编译 是 必 不 可 少 的 。 


7.2.2 使 用 JITMemoryManager 


JITMemoryManager 类 (请 参阅 <llvm_source> /include/llvm/ExecutionEngine/ 
JITMemoryManager.h) 实现 了 低层 次 的 内 存 处 理 功 能 ， 并 为 上 述 类 提供 工作 缓冲 
区 。 除 了 来 自 RTDyldMemoryManager 的 函数 之 外 ， 它 还 提供 特定 的 方法 来 帮助 JIT 
类 ， 例 如 为 单个 全 局 变量 分 配 内 存 的 allocateGlobal() ; 又 如 当 JIT 引 擎 需要 存储 
编译 生成 的 机 器 指令 时 ， 首 先 需要 分 配 具 有 读 或 者 写 权 限 的 可 执行 内 存 ， 为 此 它 会 调用 
startFunctionBody ( ) 函数 。 

在 内 部 ，JITMemoryManage 类 使 用 JITSlabAllocator 板 分 配器 (<llvm_source> 
/1ib/ExecutionEngine/JIT/JITMemoryManager .cpP) 和 MemoryBlock 单元 (<llvm_ 


source>/include/llvm/Support/Memory .h), 


7.2.3 目标 代码 输出 器 


每 个 编译 目标 均 实 现 一 个 名 为 <Target>codeEmitter 的 目标 机 器 函数 流程 (参见 
<llvm source>/lib/Target/<Target>/<Target>CodeEmitter.cpp)， 它 会 将 二 进 制 大 
对 象 中 的 所 有 指令 进行 编码 ， 并 使 用 JITCodeEmitter 写 信 内存。 例如 ,，MipsCodeEmitter 
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会 遍历 所 有 函数 基本 块 ， 并 对 每 个 机 器 指令 (MI) 调用 emitInstruction(): 


Vow 
MCE .startFunction (MF); 


for (MachineFunction::iterator MBB = MF.begin(), E = MF.end(); 
MBB != E; ++MBB){ 
MCE.StartMachineBasicBlock (MBB) ; 
for (MachineBasicBlock::instr iterator I = MBB->instr begin()， 
E = MBB->instr end(); I != E;) 
emitInstruction(*I++, *MBB),; 


| 
MIPS32 是 一 个 4 字 节 固 长 指令 集 ， 它 使 得 emitInstruction() 国 数 的 实现 变 得 
简单 : 


void MipsCodeEmitter: :emitIinstruction (MachineBasicBlock::instr_ 
iterator 
MI, MachineBasicBlock &MBB) { 


MCE .processDebugLoc (MI->getDebugLoc(), true); 
emitWord (getBinaryCodeForInstr (*MI) ) ; 
++NumEmitted; // Keep track of the # of mi's emitted 
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emitWord( ) 函数 是 JITCodeEmitter 的 简单 封装 ， 而 getBinaryCodeForInstr() 
则 通过 读 取 .ta 文件 的 指令 编码 描述 来 为 每 个 目标 生成 TableGen。<Target>CodeEmitter 
类 还 必须 实现 自 定义 方法 来 对 操作 数 和 其 他 特定 于 目标 的 实体 进行 编码 。 例 如 在 MIPS 中 ， 
mem 操作 数 必须 使 用 getMemEncoding() 函数 才能 被 正确 编码 (请 参阅 文件 <L1L1vm_ 
source>/lib/Target/Mips/MipsInstrIinfo.td): 


def mem : Operand<iPTR> { 
Woy 
let MIOperandInfo (ops ptr rc, simm16); 
let EncoderMethod = "getMemEncoding'" ; 
| 

} 


因此 ，MipsCodeEmitter 必须 实现 MipsCodeEmitter: :getMemEncoding() 郴 
数 来 匹配 该 TableGen 描述 。 图 7-1 显示 几 个 代码 输出 器 与 JIT 框架 之 间 的 关系 。 


MachineCodeEmitter RTDyldMemoryManager 


JITMemoryManager 
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7.2.4 目标 信息 


为 了 支持 即时 编译 ， 每 个 编译 目标 还 必须 提供 一 个 TargetJITInfo 子 类 (请 参阅 
include/llvm/Target/TargetJITInfo.h), 例如 MipsJITInfoor 或 X86JITInfo。 
TargetJITInfo 类 为 每 个 编译 目标 需要 实现 的 通用 JIT 功能 提供 了 一 个 接口 。 下 面 的 列表 
简单 描述 了 这 些 功能 : 

e 为 了 支持 执行 引擎 需要 重新 编译 某 个 函数 的 情形 (很 可 能 因为 该 函数 在 编译 后 又 被 修 

改 )， 每 个 编译 日 标 都 需 实现 TargetJITInfo: :replaceMachineCodeForFun 
ction( ) 方法 ， 用 来 将 调用 旧版 函数 的 指令 蔡 换 为 调用 或 跳 转 至 新 版 函数 的 指令 。 
这 个 功能 是 支持 自 改 功能 的 代码 所 必需 的 。 

e TargetJITInfo::relocate() 方法 为 当前 编译 好 的 函数 中 每 个 符号 打 补 丁 ， 使 
其 指向 正确 的 内 存 地 址 ， 该 过 程 类 似 于 动态 链接 器 的 作用 。 

e TargetJITInfo: :emitFunctionStub( ) 方法 会 输出 一 个 桩 函数 ， 其 功能 是 调 
用 给 定 地 址 的 另 一 个 函数 。 每 个 编译 目标 还 需 为 该 桩 函数 提供 以 字 节 为 大 小 单位 和 
对 齐 方式 的 TargetJITInfo: :StubLayout 信息 。 这 些 有 关 编 译 目 标的 信息 是 
JITEmitte 为 即将 输出 的 桩 函数 进行 内 存 空间 分 配 的 计算 依据 。 

虽然 TargetJITInfo 方法 的 目标 不 是 输出 像 函 数 体 生成 这 样 的 常规 指令 ， 但 它们 仍 
需 为 桩 函数 的 生成 输出 特定 指令 ， 并 调用 新 的 内 存 地 址 。 但 在 JIT 框架 刚 形 成 时 ， 并 没有 可 
以 依赖 的 接口 去 帮助 输出 在 MachineBasicBlock 之 外 的 独立 指令 ; 而 现在 MCJIT 框架 
内 的 McInsts 可 以 完成 这 项 任务 。 如 果 没 有 MCInsts 类 ， 旧 的 JIT 框架 会 强制 编译 目标 
手动 完成 这 些 指令 的 编码 。 

为 了 说 明 <Target>JITInfo 的 实现 如 何 手动 输出 指令 ， 可 以 参考 MipsJITInfo: :emit- 
FunctionStub( ) 的 代码 ( 见 <11vm_source>/1Lib/Target/Mips/MipsJITInfo.cpP)， 
它 使 用 下 面 的 代码 来 生成 四 条 指令 : 


// lui S$t9, %hi (Emittedaddr) 

// addiu $t9, $t9, $lo(Emittedaddr) 

// jalr S$t8, S$t9 

// nop 

if (IsLittleEndian) { 
JCE.emitWordLE (0xf << 26 | 25 << 16 | Hi); 
JCE.emitWordLE(9 << 26 | 25 << 21 | 25 << 16 | Lo); 
JCE.emitWordLE(25 << 21 | 24 << 11 | 9); 
JCE.emitWordLE (0) ; 


7.2.5 学 习 如 何 使 用 JIT 类 


JIT 是 ExecutionEngine 的 子 类 , 在 <llvm source>/1lib/ExecutionEngine/ 
JIT/JIT.h 中 声明 。JIT 类 是 使 用 JIT 基础 结构 编译 函数 方法 的 人 口 点 。 
ExecutionEngine: :create( ) 方法 使 用 默认 的 JITMemoryManager 来 调用 JIT: : 
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-六 


和 


createJIT()。 之 后 ，JIT 构造 函数 执行 以 下 任务 : 

@ 创建 一 个 JITEmitter 实例 

e 初始 化 目标 信息 对 象 

e 添加 代码 生成 流程 

e 添加 在 最 后 运行 的 <Target>CodeEmitter 流程 

当 JIT 系统 被 要 求 编 译 一 个 函数 时 ，JIT 引擎 会 持 有 一 个 PassManager 对 象 来 调用 所 
有 的 代码 生成 和 JIT 输出 流程 。 

为 了 说 明 这 一 切 如 何 发 生 ， 下 面 描述 如 何 用 JIT 编译 在 第 5 章 和 第 6 章 中 使 用 的 sum. 
bc 位 码 文件 的 函数 。 我 们 的 目标 是 检索 出 sum 函数 ， 并 通过 JIT 系统 用 运行 时 参数 计算 两 


个 不 同 的 加 法 。 


步骤 如 下 : 


1. 首先 创建 一 个 名 为 sum-jit.cpp 的 新 文件 ， 我 们 需要 引入 JIT 执行 引擎 资源 : 


#include 


"llvm/ExecutionEngine/JIT.h" 


2. 引入 其 他 用 于 读 写 LLYM 位 码 、 上 下 文 接口 等 的 头 文件 ， 并 导入 LLVM 命名 空间 : 


#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 


"lvm/ADT/OwningPtr.h" 
"Jlvm/Bitcode/ReaderWriter.h" 
"Ilvm/IR/LLVMContext.h" 
"1L1Vvm/IR/Module .hn 
"llvm/Support/FileSystem.h" 
"J]lvm/Support/MemoryBuffer.h" 
"J]lvm/Support/ManagedSstatic.h" 
"llvm/Support/raw_ ostream.h" 
"llvm/Support/system error.h" 
"lvm/Support/TargetSelect.h" 


using namespace llvm; 


3. 用 InitializeNativeTarget() 图 数 设置 编译 目标 主机 ， 并 确保 JIT 需要 使 用 
的 目标 相关 库 已 被 链接 。 与 之 前 类 似 ， 我 们 需要 线程 独立 的 上 下 文 LLVMContext 对 象 和 
MemoryBuffer 对 象 来 从 磁盘 读 取 位 码 文件 ， 如 下 面 的 代码 所 示 : 


int main() { 


InitializeNativeTarget (); 
LLVMContext Context; 
std: :string ErrorMessage; 


OwningPtr<MemoryBuffer> Buffer; 


4. 我们 使 用 getFile( ) 函数 从 磁盘 读 取 数据 ， 如 下 面 的 代码 所 示 : 


if (MemoryBuffer::getFile("./sum.bc", Buffer)) { 


errs() << "sum.bc not found\n"; 


return 


} 


=17 


5. ParseBitcodeFile 也 数 从 MemoryBuffer 中 读 取 数 据 ， 并 生成 相应 的 LLVM 
Module 类 来 表示 它 ， 如 下 面 的 代码 所 示 : 
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Module *M = ParseBitcodeFile(Buffer.get(), Context, 
&ErrorMessage); 
if (!M) { 
errs() << ErrorMessage << "\n"; 
return -1; 


} 
6. 通过 使 用 EngineBuilder 类 的 create 方法 创建 一 个 ExecutionEngine 实例 ， 
如 下 面 的 代码 所 示 : 


OwningPtr<ExecutionEngine> EE (EngineBuilder(M) .create()) ; 


此 方法 默认 创建 一 个 JIT 执行 引擎 ， 并且 是 JIT 设置 点 ; 该 方法 间接 调用 JIT 构造 函 
数 ， 该 构造 函数 会 创建 JIITEmitter ( 它 是 PassManager)， 并 初始 化 所 有 代码 生成 和 特 
定 于 目标 的 输出 流程 。 到 这 里 , JIT 引擎 已 经 知道 LLVM 模块 的 存在 ， 但 尚未 编译 任何 函数 。 

仍然 需要 调用 getPointerToFunction() 才能 编译 函数 ， 该 方法 会 返回 一 个 指向 
JIT 编译 完成 的 原生 函数 的 指针 。 如 果 顶 数 还 没有 被 编译 ， 则 会 进行 JIT 编译 并 返回 函数 指 
针 。 图 7-2 说 明了 编译 过 程 。 


MipsCodeEmitter:emitlnstruction 


MipsCodeEmitter::runOnFunction 
PassManager::run() CodeGen 流程 


图 7-2 





7. 通过 getFunction( ) 函数 获取 表示 sum 的 Function IR 对 象 : 


Function *SumFn = M->getFunction("sum"),; 


在 这 里 ，JIT 编译 被 触发 : 


int (*Sum) (int, int) = (int (*) (int, int)) 
EE->getPointerToFunction (SumFn); 


你 需要 对 此 函数 指针 进行 与 原 函 数 匹 配 的 类 型 转换 。 由 于 Sum 函数 具有 define i32 @ 
sum(i32%a,i32%b) 的 LLVM 原型 ， 因 此 我 们 使 用 int (*)(int,int) 的 C 原 型 。 

男 一 个 选择 是 通过 使 用 getPointerToFunctionOrstub() 了 函数 而 不 是 
getPointerToFunction() 以 进行 惰性 编译 。 如 果 目 标 函 数 尚未 编译 并 且 启 用 了 惰性 编 
译 ， 则 会 生成 桩 函数 并 返回 其 指针 。 桩 函数 是 一 个 小 函数 ， 其 中 包含 一 个 占 位 符 ， 之 后 这 个 
占 位 符 会 被 填充 成 跳 转 / 调用 实际 函数 的 指令 。 

8. 接 下 来 ,我 们 通过 由 sum 所 指向 的 已 完成 JIT 编译 的 函数 来 调用 原始 Sum 函数 ， 如 
下 面 的 代码 所 示 : 
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int res = Sum(4,5); 
outs() << "Sum result: " << res << "\n"; 


在 使 用 惰性 编译 时 ，sum 会 调用 桩 函数 ， 后 者 使 用 一 个 编译 回调 函数 对 原 函 数 进行 即时 
编译 。 然 后 ， 桩 函数 中 的 占 位 符 将 被 重 定向 到 执行 编译 好 的 函数 。 除 非 在 Module 中 的 原 
始 sum 函数 改变 ， 否 则 这 个 函数 无 须 再 被 编译 。 

9. 再 次 调用 Sum 以 计算 下 一 个 结果 ， 如 下 面 的 代码 所 示 : 


res = Sum(res, 6); 
outs() << "Sum result: " << res << "\n'; 


在 惰性 编译 环境 中 ， 由 于 原始 函数 已 经 在 第 一 个 sum 调用 中 编译 ， 所 以 第 二 个 调用 直 
接 执行 本 地 函数 。 

10. 前 面 使 用 JIT 编译 的 Sum 函数 成 功 计算 了 两 个 加 法 。 现 在 我 们 释放 执行 引擎 分 配 的 
内 存 空间 ， 其 中 包含 函数 代码 。 调 用 11vm_shutdown ( ) 函数 并 返回 : 


EE->freeMachineCodeForFunction (SumFn); 
llvm shutdown(); 
return 0; 


} 
要 编译 和 链接 sum-jit .cpp， 可 以 使 用 下 面 的 命令 行 : 


$ clang++ sum-jit.cpp -g -03 -rdynamic -fno-rtti $(llvm-config --cppflags 
--ldflags --libs jit native irreader) -o sum-jit 


或 者 ， 也 可 以 使 用 第 3 章 中 的 Makefile， 并 添加 -rdynamic 标志 ， 然 后 更 改 你 的 1Lvm- 
config 调 用 以 使 用 上 述 命 令 中 指定 的 库 。 尽 管 这 个 例子 没有 使 用 外 部 函数 ， 但 是 
-rdynamic 标志 对 于 确保 在 运行 时 进行 外 部 函数 解析 是 很 重要 的 。 

运行 该 示例 并 检查 输出 : 

$ ./sum-jit 

Sum result: 9 


Sum result: 15 


通用 值 类 型 

在 前 面 的 例子 中 ,我 们 将 返回 的 函数 指针 转换 为 正确 的 原型 ， 以 便 用 C 风格 的 函数 调 
用 来 调用 该 函数 。 但 是 ， 当 处 理 具有 大 量 签名 和 参数 类 型 的 多 个 函数 时 ， 我 们 需要 更 灵活 的 
方式 来 执行 函数 。 

执行 引擎 提供 了 调用 JIT 编译 函数 的 另 一 种 方式 。runFunction( ) 方法 可 以 编译 并 运 
行 一 个 函数 ， 其 参数 由 元 素 为 Genericvalue 类 型 组 成 的 向 量 提供 ,这样 就 不 需要 事先 调 
用 getPointerToFunction()。 

GenericValue 结构 被 定义 在 <llvm_source>/include/llvm/ExecutionEngine/ 
GenericValue.h 中 ， 它 能 够 保存 任何 通用 类 型 。 现 在 我 们 对 上 一 个 例子 进行 修改 ， 改 用 
runFunction() 代替 getPointerToFunction() 和 指针 类 型 转换 。 

首先 ， 创 建 sum-jit-gv.cpp 文件 来 保存 这 个 新 版 本 ， 并 在 顶部 添加 GenericValue 
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#include "llvm/ExecutionEngine/GenericValue.h" 


从 sum-jit.cpp 中 复制 剩 下 的 部 分 ， 在 此 基础 上 开始 修改 。 在 进行 sumFn 函数 指 
针 初 始 化 之 后 ， 创 建 由 GenericValue 结构 体 构 成 的 向 量 FnArgs， 并 通过 APInt 接口 
(<11vm_source>/include/11vm/RADT/RAPInt.h) 用 整数 值 填充 它 。 根 据 原始 函数 原 
型 sum(i32%a,i32%b)， 使 用 两 个 32 位 宽 的 整数 : 

Wa st 


Function *SumFn = M->getFunction("sum"); 
std: :vector<GenericValue> FnArgs (2) ; 
FnArgs [0] .IntVal = APInt (32,4); 
FnArgs [1] .IntVal = APInt (32,5); 


使 用 函数 参数 和 参数 向 量 调用 zunFunction()， 这 使 得 函数 被 JIT 编译 后 执行 。 医 
数 的 结果 也 是 GenericValue 类 型 ， 可 以 根据 原 函 数 的 返回 类 型 ( i32 类 型 ) 相应 地 进行 
访问 : 


GenericValue Res = EE->runFunction(SumFn, FnArgs); 
outs() << "Sum result: " << Res.IntVal << "\n"; 


对 第 二 个 加 法 重复 相同 的 过 程 : 


FnArgs [0] .IntVal = Res.IntVal; 

FnArgs [1] .IntVal = APInt (32,6); 

Res = EE->runFunction(SumFn, FnArgs); 

outs() << "Sum result: " << Res.IntVal << "\n"; 
ee 


7.3 llvm::MCJIT 框架 介绍 


MCJIT 类 是 LLVM 的 新 型 JIT 实现 。 它 与 旧版 JIT 实现 的 不 同 之 处 在 于 使 用 了 MC 框 
架 ， 该 框架 层 在 第 6 章 中 探讨 过 。MC 框架 提供 了 统一 的 指令 表示 ， 也 是 汇编 器 、 反 汇编 器 、 
汇编 格式 打印 机 和 MCJIT 所 共享 的 框架 。 

使 用 MC 库 的 第 一 个 优点 是 编译 目标 只 需要 指定 其 指令 编码 格式 一 次 ， 之 后 所 有 的 子 系 
统 将 共用 该 信息 。 因 此 在 编写 LLVM 后 端 时 ， 如 果 为 目标 实现 了 对 象 代码 输出 功能 ， 则 JIT 
模块 也 会 具有 该 功能 。 

llvm: :JIT 框架 将 在 LLVM 3.5 版 本 之 后 被 删除 ， 并 被 1lvm: :MCJIT 框架 完全 替 
代 。 那 么 ， 为 什么 我 们 要 学 习 旧 的 JIT 呢 ? 其 原因 在 于 ， 尽 管 它 们 大 部 分 实现 不 同 ， 但 
ExecutionEngine 类 是 通用 的 ， 并 且 大 多 数 概念 对 两 个 引擎 都 适用 。 最 重要 的 是 ， 在 
LLVM 3.4 的 发 行 版 本 中 ，MCJIT 框架 不 支持 如 惰性 编译 等 部 分 特性 ， 所 以 仍 不 能 完全 替代 
旧版 JIT。 


7.3.1 MCJIT 引擎 
创建 MCJIT 引擎 的 方式 与 旧 JIT 引 擎 相 同 ， 都 是 需要 调用 ExecutionEngine:: 
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create()。 此 方法 进而 调用 MCJIT: :createJIT() 以 执行 MCJIT 构造 阴 数 。MCJIT 类 
在 <llvm source>/1ib/ExecutionEngine/MCJIT/MCJIT.h 中 声明。createJIT() 
方法 和 MCJIT 构造 函数 的 实现 在 文件 <llvm_source>/1lib/ExecutionEngine/MCJIT/ 
MCJIT.cpp 中 。 
MCJIT 构造 函数 将 创建 一 个 SectionMemoryManager 实例 ， 并 将 LLVM 模块 添加 
到 其 内 部 模块 容器 owningModulecontainer 中 ， 然 后 初始 化 编译 目标 信息 。 
模块 的 状态 
MCJIT 类 会 为 在 引擎 构建 过 程 中 插入 的 初始 LLVM 模块 实例 指定 状态 ， 这 些 状 态 包括 : 
e 已 添加 : 这 些 模 块 包含 尚未 编译 但 已 经 添加 到 执行 引擎 的 一 组 模块 。 这 个 状态 的 存 
在 允许 模块 向 其 他 模块 显露 函数 定义 ， 并 将 它们 的 编译 推迟 到 需要 的 时 候 。 
e 已 加 载 : 这 些 模 块 处 于 JIT 编译 状态 ,但 尚未 做 好 执行 准备 。 还 需要 执行 包括 重 定位 
和 内 存 页 面 的 权限 分 配 等 步骤 。 和 希望 在 内 存 中 重新 映射 JIT 编译 函数 的 客户 端 可 以 通 
过 使 用 处 于 已 加 载 状态 的 模块 ， 以 避免 执行 重新 编译 过 程 。 
e 已 完成 : 这 些 模块 包含 准备 执行 的 函数 。 在 这 种 状态 下 ， 由 于 重 定位 已 经 被 应 用 ， 阴 
数 不 能 被 重 映射 。 
JIT 和 MCJIT 的 一 个 主要 区 别 在 于 模块 状态 。 在 McCJIT 中 ， 整 个 模块 必须 在 请 求 符 
号 地 址 (函数 和 其 他 全 局 变量 ) 之 前 处 于 已 完成 状态 。 
MCJIT: :finalizeobject() 函数 将 已 添加 状态 下 的 模块 转换 为 已 加 载 状 态 ， 最 后 进 
入 已 完成 状态 。 首 先 ， 它 通过 调用 generateCodeForModule() 来 生成 已 加 载 的 模块 。 
接 下 来 ， 所 有 模块 都 通过 finalizeLoadedModules( ) 函数 进入 已 完成 状态 。 
与 旧版 JIT 不 同 , MCJIT: :getPointerToFunction( ) 函数 要 求 在 被 调用 之 前 Module 
对 象 处 于 已 完成 状态 。 因 此 ， 调 用 它 之 前 必须 首先 调用 MCJIT: :finalizeObject()。 
在 LLVM 3.4 版 本 中 新 添加 的 函数 消除 了 此 限制 : getPointerToFunction( ) 方法 
被 弃 用 ， 而 增添 了 getFunctionRaddress ( ) 。 该 新 方法 会 在 请 求 符号 地 址 之 前 加 载 和 完 
成 模块 ， 因 此 不 需要 调用 fnalizeobject()。 


请 注意 ， 在 旧版 JIT 中 执行 引擎 对 每 个 函数 都 进行 JIT 编译 和 执行 。 而 在 MCJIT 
中 ， 整 个 模块 (包括 所 有 函数 ) 必须 在 完成 所 有 函数 的 JIT 编译 之 后 才能 执行 其 
中 的 任意 函数 。 由 于 编译 粒度 扩大 ， 我 们 不 能 再 称 其 为 基于 函数 的 框架 ， 而 是 一 
个 基于 模块 的 编译 引擎 。 


7.3.2 ”MCJIT 中 模块 编译 过 程 


代码 生成 过 程 发 生 在 Module 对 象 加 载 阶段 ， 由 <llvm_source>/1ib/Execution 
Engine/MCJIT/MCJIT.cpp 中 的 MCJIT: :generateCcodeForModulel() 方 法 触发 。 
该 方法 执行 以 下 任务 : 

e 创建 一 个 用 于 保存 Module 对 象 的 ObjectBuffer 实例 。 如 果 Module 对 象 已 经 
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被 加 载 (编译 )， 则 使 用 objectcache 接口 检索 该 对 象 并 避免 重 编译 。 

e 如 果 不 存 在 之 前 的 缓存 ，MCJIT: :emitobject( ) 将 执行 MC 代码 输出 。 执 行 结 果 
是 一 个 ObjectBufferStream 对 象 (一 个 支持 流 的 ObjectBuffer 子 类 )。 

e RuntimeDyld 动 态 链接 器 加 载 上 述 步 骤 的 结果 ObjectBuffer 对 象 ， 并且 
通过 RuntimeDyld::1oadobject() 构 建 一 个 符号 表 。 该 方法 会 返回 一 个 
ObjectImage 对 象 。 

e 模块 被 标记 为 已 加 载 。 

7.3.2.1 对象 缓冲 区 、 缓 存 和 映像 

ObjectBuffer 类 (<llvm source>/include/llvm/ExecutionEngine/ 
ObjectBuffer.h) 实现 对 MemoryBuffer 类 (<llvm source>/include/1llvm/Support/ 
MemoryBuffer.h) 的 封装 。 

MemoryBuffer 类 被 MCObjectStreamezr 子 类 用 来 将 指令 和 数据 输出 到 内 存 。 此 外 ， 
ObjectCcache 类 直接 引用 MemoryBuffer 实例 ， 并 且 能 够 从 中 获取 ObjectBuffer。 

ObjectBufferStream 类 是 一 个 ObjectBuffer 子 类 ， 它 具有 附加 的 标准 C++ 流 
操作 符 (例如 >> 和 <<)， 并 简化 了 内 存 缓冲 区 的 读 / 写 操作 的 实现 。 

ObjectImage 对象 ( <llvm source>/include/llvm/ExecutionEngine/Object- 
Image.h) 用 于 存放 已 加 载 的 模块 ， 它 可 以 直接 访问 objectBuffer 和 ObjectFile 引 
用 。objectFile 对 象 (<llvm source>/include/1L1vm/object/objectFile.h ) 
由 特定 于 编译 目标 的 目标 文件 类 型 (如 ELF、COFF 和 MachO) 特 化 。objectFile 对 象 能 
够 直接 从 MemoryBuffer 对 象 中 检索 符号 、 重 定位 和 段 信 息 。 

图 7-3 说 明 各 个 类 之 间 的 关系 ， 实 线 箭 头 表示 合作 关系 ， 虚 线 箭 头 表示 继承 关系 。 


ObjectCache 






Objectlmage ObjectBuffer MemoryBuffer 
8 ES 
ObjectFile 
ObjectBufferStreamer 


MatchOObjectFile ELFObjectFile 
图 7-3 





7.3.2.2 ”动态 链接 

由 MCJIT 加 载 的 模块 对 象 由 ObjectImage 实例 表示 。 如 前 所 述 ， 它 可 以 通过 独立 
于 目标 的 ObjectFile 接口 对 内 存 缓冲 区 进行 透明 访问 。 因 此 ， 它 可 以 处 理 符号 、 段 和 重 
定位 。 


MCJIT 具有 用 以 生成 objectImage 对 象 的 动态 链接 功能 ， 该 功能 由 RuntimeDyld 
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类 提供 。 该 类 提供 了 使 用 这 些 功能 的 公共 接口 ， 而 实际 的 实现 由 根据 目标 文件 类 型 特 化 的 
RuntimeDyldImpl 对 象 提供 。 

因此 , RuntimeDyld: :loadObject() 方法 从 objectBuffer 中 生成 ObjectImage 
对 象 的 过 程 如 下 : 首先 创建 一 个 特定 于 目标 的 RuntimeDyldImpl 对象， 然后 调用 其 
RuntimeDyldImp1::1loadobject() 方法 。 此 过 程 中 还 会 创建 一 个 objectFile 对 象 ， 
可 以 通过 objectImage 对 象 检 索 到 它 。 图 7-4 说 明了 这 个 过 程 。 













loadObject() loadObject() 





\ 
| 


RuntimeDyld RuntimeDyldimpl 


RuntimeDyldELF RuntimeDyldMachO 


图 7-4 





在 模块 的 完成 阶段 ， 运 行 时 RuntimeDy1d 动态 链接 器 被 用 于 解析 重 定位 以 及 为 模块 
对 象 注册 异常 处 理 帧 。 回 想 一 下 ， 执 行 引擎 的 getFunctionaddress() 和 getPointer 
ToFunction( ) 方法 要 求 引擎 获得 符号 (函数) 地 址 。 为 了 解决 这 个 问题 ,MCJIT 还 通过 Runtime 
Dyld: :getSymbolLoadRddress ( ) 方法 使 用 RuntimeDyld 来 请 求 符号 地 址 。 

7.3.2.3 内存 管理 器 

LinkingMemoryManager 类 ( 男 一 个 RTDyldMemoryManager 子 类 ) 是 MCJIT 引 
擎 所 使 用 的 实际 内 存 管理 器 。 它 整合 了 一 个 SectionMemoryManager 实例 ， 并 向 其 发 送 
代理 请 求 。 

每 当 动 态 链 接 器 RuntimeDyld 通过 LinkingMemoryManager::getSymbolAdd 
ress() 请 求 符 号 地 址 时 ， 它 有 两 个 选项 : 如 果 符 号 在 已 编译 模块 中 可 用 ， 则 从 MCJIT 获 
取 该 地 址 ; 否则 ， 它 向 由 SectionMemoryManager 实例 加 载 和 映射 的 外 部 库 请 求 该 地 
址 。 图 7-5 说 明了 此 机 制 ， 详 细 信 息 请 参阅 <llvm_source>/1lib/ExecutionEngine/ 
MCJIT/MCJIT.cpp 中 的 LinkingMemoryManager: :getSymbolAddress()。 


RuntimeDyld MCJIT 


getSymbolAddress() getSymbolAddress() 


LinkingMemoryManager setSymbolAddress0 SectionMemoryManager 


RTDyldMemoryManager 








色 肝 编译 器 135 


SectionMemoryManager 实例 是 一 个 简单 的 管理 器 。 作 为 一 个 RTDyldMemoryManager 
子 类 ，SectionMemoryManager 继承 了 其 全 部 库 查 找 方 法 ,但 它 是 通过 直接 处 理 低层 次 
的 MemoryBlock 单元 来 实现 代码 和 数据 段 的 分 配 ( 详 见 <llvm_source>/include/ 
llvm/Support/Memory.h), 

7.3.2.4 ”MC 代码 输出 

MCJIT 通过 调用 MCJIT: :emitobject() 来 执行 MC 代码 输出 ， 该 方法 执行 以 下 
任务 : 

e 创建 一 个 PassManager 对 象 。 

e 添加 一 个 目标 布局 流程 ， 并 调用 addPassesToEmitMC() 来 添加 所 有 代码 生成 和 

MC 代码 输出 流程 。 
e 使 用 PassManager::run() 方法 运行 所 有 流程 。 生 成 的 代码 存储 在 object 
BufferStream 对 象 中 。 

e 将 编译 好 的 对 象 添 加 到 objectcache 实例 中 并 返回 它 。 

MCJIT 中 的 代码 输出 过 程 比 旧版 JIT 更 加 统一 。 因 为 MCJIT 框架 透明 地 使 用 现 有 MC 
基础 架构 中 的 所 有 信息 ， 而 旧版 JIT 需要 手动 提供 自 定 义 的 输出 器 和 目标 信息 。 

7.3.2.5 ”对 象 终止 

最 后 ， 模 块 对 象 通过 MCJIT: :finalizeLoadedModules() 函数 完成 所 有 编译 阶段 : 
重 定位 被 解析 ， 已 加 载 的 模块 将 移 至 已 完成 的 模块 组 ， 并 调用 LinkingMemoryManager:: 
finalizeMemory() 更 改 内 存 页 面 权限 。 在 完成 阶段 后 ,MCJIT 编译 的 函数 就 可 以 被 执 
行 了 。 


7.3.3 使 用 MCJIT 引擎 


以 下 sum-mcjit .cpp 源 文件 包含 通过 MCJIT 框架 (而 不 是 旧版 JIT) 编译 Sum 示例 
函数 的 必要 代码 。 为 了 说 明 与 之 前 使 用 的 旧版 JIT 框架 的 相似 性 ， 我 们 保留 了 相应 的 代码 ， 
并 通过 布尔 类 型 的 UseMcJIT 变量 来 判定 应 该 使 用 旧版 JIT 框架 ， 还 是 新 版 MCJIT 框架 。 
由 于 此 代码 与 sum-jit.cpp 示例 代码 非常 相似 ， 所 以 我 们 在 这 里 不 再 重复 描述 此 前 已 经 
出 现 过 的 示例 代码 片段 。 

1. 首先 引入 MCJIT 头 文件 ; 


#include "llvm/ExecutionEngine/MCJIT.h" 


2. 引入 所 有 其 他 必要 的 头 文件 ， 并 导入 11vm 命名 空间 : 


#include "llvm/ADT/OwningpPtr.h" 
#include "llvm/Bitcode/ReaderWriter.h" 
#include "llvm/ExecutionEngine/JIT.h" 
#include "llvm/IR/LLVMContext.h" 
#include "llvm/IR/Module.h" 

#include "llvm/Support/MemoryBuffer.h" 
#include "llvm/Support/ManagedStatic.h" 
#include "llvm/Support/TargetSelect.h" 
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#include "llvm/Support/raw ostream.h" 
#include "llvm/Support/system error.h" 
#include "llvm/Support/FileSystem.h" 
using namespace llvm; 


3. 将 UseMCJIT 布尔 值 设 置 为 true 以 测试 MCJIT 框架 。 将 其 设置 为 false 则 会 使 
用 旧版 JIT 运行 此 示例 : 


bool UseMCJIT = true; 


int main() { 
InitializeNativeTarget () ; 


4. MCJIT 需要 初始 化 汇编 解析 占 和 输出 器 : 


if (UseMCJIT) { 
InitializeNativeTargetAsmPrinter(); 
InitializeNativeTargetAsmParser(); 


} 


LLVMContext Context; 
std::string ErrorMessage; 
Owningptr<MemoryBuffer> Buffer; 


if (MemoryBuffer::getFile("./sum.bc", Buffer)) { 
errs() << "sum.bc not found\n"; 
return -1; 


} 

Module *M = ParseBitcodeFile (Buffer.get(), Context, 
&ErrorMessage); 

if (!M) { 
errs() << ErrorMessage << "\n"; 
return -1; 


} 


5. 创建 执行 引擎 并 调用 setUseMCJIT(true) 函数 通知 引擎 使 用 MCJIT 框架 ， 如 下 
面 的 代码 所 示 : 


OwningPtr<ExecutionEngine> EE; 
if (UseMCJIT) 

EE.reset (EngineBuilder (M) .setUseMCJIT(true) .create()) ; 
else 

EE.reset (EngineBuilder (M) .create()); 


6. 旧版 JIT 框架 需要 引用 Function， 该 引用 稍 后 用 于 检索 函数 指针 并 销毁 已 分 配 的 
内 存 : 


Function* SumFn = NULL; 
if (!UseMCJIT) 
SumFn = cast<Function>(M->getFunction("sum")); 


7. 如 前 所 述 ，MCJIT 框架 已 经 不 支持 getPointerToFunction( )， 而 仅 支持 getFunction 
Address()。 因 此 ， 我们 要 对 每 个 JIT 类 型 使 用 正确 的 函数 : 
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int (*Sum) (int, int) = NULL; 
if (UseMCJIT) 
Sum = (int (*) (int, int)) EE->getFunctionAddress (std::string(" 
sum")); 
else 
Sum = (int (*) (int, int)) EE->getPointerToFunction (SumFn),; 
int res = Sum(4,5); 
outs() << "Sum result: " << res << "\n", 
res = Suml(res, 6); 
outs() << "Sum result: " << res << "\n'"; 


8. 由 于 MCJIT 一 次 编译 整个 模块 ， 所 以 释放 存储 Sum 函数 的 机 器 码 的 内 存 空 间 只 在 旧 
版 IT 中 才 有 意义 : 


if (!UseMCJIT) 
EE->freeMachineCodeForFunction (SumFn); 


llvm shutdown(); 
return 07 


} 
要 编译 并 链接 sum-mcjit .cpp， 请 使 用 以 下 命令 : 


$ clang++ sum-mcjit.cpp -g -03 -rdynamic -fno-rtti $(llvm-config 
--cppflags --ldflags --libs jit mcjit native irreader) -o sum-mcjit 


或 者 ， 也 可 以 使 用 第 3 章 中 修改 后 的 Makefile。 运 行 以 下 示例 并 检查 输出 : 


$ ./sum-mcjit 
Sum result: 9 


Sum result: 15 


7.4 使 用 LLVM JIT 编译 工具 
LLVM 提供 了 几 个 工具 来 操作 JIT 引擎 ， 例 如 111 和 11lvm-rtdyld。 


7.4.1 使 用 出 工具 


解释 器 工具 (lli) 通过 使 用 本 章 中 介绍 的 LLVM 执行 引擎 来 实现 LLVM 位 码 解释 器 和 
JIT 编译 胡 。 我 们 来 看 一 下 源 文件 sum-main.c: 


#include <stdio.h> 


int sum(int a, int b) { 
return a + b; 


} 


int main() { 
printf ("sum: %d\n", sum(2, 3) + sum(3, 4)); 
return 0; 


} 
在 主 函 数 存在 时 ，11i 工具 能 够 直接 运行 位 码 文 件 。 使 用 clang 生成 sum-main.bc 


位 码 文件 : 
$ clang -emit-llvm -c sum-main.c -Oo sum-main.bc 


现在 ,使 用 旧版 JIT 编译 引擎 通过 11i 运行 位 码 : 


$ 11i sum-main.bc 


sum: 12 


或 者 ， 也 可 以 使 用 MCJIT 引擎 : 


$ 11li -use-mcjit sum-main.bc 


sum: 12 


还 有 一 个 使 用 解释 器 的 标志 ， 通 常 要 慢 得 多 : 


$ 111 -force-interpreter sum-main.bc 


sum:12 


7.4.2 使 用 llvm-rtdyld 工具 


llvm-rtdyld TT 具 (<llvm source>/tools/llvm-rtdyld/llvm-rtdyld.cpp) 
是 一 个 测试 MCJIT 对 象 加 载 和 链接 框架 的 简单 工具 。 该 工具 能 够 从 磁盘 读 取 二 进 制 对 象 
文件 ， 并 执行 通过 命令 行 指定 的 函数 。 它 不 执行 IT 编译 和 执行 ， 但 允许 测试 和 运行 目标 
区 作 s 

考虑 以 下 三 个 C 源 代码 文件 : main.c、add.c 和 sub.c: 


® main.ece 


42 add (int a int bs 
int sub (int a int byy 


int main() { 
return subladd(3,4), 2); 
} 
® add.c 


int add(int a, int b) { 
return a+b; 


} 


e BUb.Ee 


int sub(int a, int b) { 
return a-b; 


} 
将 这 些 源 文件 编译 成 目标 文件 : 


$ clang -c main.c -oo main.o 
$ clang -c add.c -o add.o 
$ clang -c sub.c -o sub.o 


使 用 带 -entry 和 -execute 选项 的 1l1vm-rtdyld 工具 执行 main 函数 : 
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$ llvm-rtdyld -execute -entry= main main.o add.o sub.o; echo $? 
loaded ' main' at: 0x104d98000 
5 


男 一 个 选项 是 使 用 -printline 选项 输出 带 有 调试 信息 的 编译 函数 行 信息 ， 例 如 下 述 
代码 : 
$ clang -g -c add.c -o add.o 
$ llvm-rtdyld -printline add.o 
Function: add, Size = 20 
Line info @ 0: add.c, line:2 
Line info @ 10: add.c, line:3 
Line info @ 20: add.c, line:3 


可 以 使 用 11vm-rtdyld 工具 查看 MCJIT 框架 中 的 抽象 对 象 。11vm-rtdy1ld 工具 首 
先 读 取 二 进 制 对 象 文件 列表 用 以 生成 ObjectBuffer 对 象 ， 然 后 使 用 RuntimeDy1ld: : 
loadobject() 生成 objectImage 实例 。 在 加 载 所 有 的 目标 文件 后 ， 它 使 用 RuntimeDy1 
d: :resolveRelocations () 来 完成 重 定 位 的 解析 。 它 接 下 来 通过 getsymbolAddress() 
解析 入 口 点 ， 并 调用 函数 。 

11vm-ztdy1ld 工 具 还 使 用 定制 的 内 存 管 理 器 TrivialMemoryManager。 这 是 一 个 
简单 的 RTDyldMemoryManager 子 类 的 实现 ， 也 很 容易 理解 。 

这 个 有 用 的 概念 验证 工具 可 以 帮助 用 户 理解 MCJIT 框架 中 涉及 的 基本 概念 。 


7.5 ”其 他 资源 

你 还 可 以 通过 在 线 文档 和 示例 等 其 他 资源 了 解 LLVM JIT。 在 LLVM 源码 树 中 ,<11lvm_ 
source>/examples/HowToUseJIT 和 <llvm source>/examples/ParallelJIT 
包含 了 简单 的 源 代码 示例 ， 这 些 示 例 对 于 学 习 JIT 基础 知识 很 有 用 。 

LLVM 万 花 简 教程 (http://llvm.org/docs/tutorial) 中 有 一 个 专门 介绍 如 何 
使 用 JIT 的 章节 : http://llvm.org/docs/tutorial/LangImpl14.html。 

与 MCJIT 设计 和 实现 有 关 的 更 多 信息 也 可 以 在 http://llvm.org/docs/MCJITDesign 
AndImplementation.html 找到 。 


7.6 ”总结 

JIT 编译 是 指 常见 虚拟 机 环境 中 的 运行 时 编译 特性 。 在 本 章 中 ， 我 们 通过 展示 旧版 JIT 
和 新 版 MCJIT 的 这 两 种 实现 方法 ,探索 LLVM 的 JIT 执行 引擎。 此 外 ， 我 们 检查 和 比较 
了 这 两 种 方法 的 实现 细节 ， 并 提供 了 关于 如 何 构建 工具 以 使 用 JIT 引擎 的 实例 。 

在 下 一 章 中 ， 我 们 将 介绍 交叉 编译 、 工 具 链 以 及 如 何 创建 基于 LLVM 的 交叉 编译 器 。 
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传统 的 编译 器 将 源 代码 转换 为 原生 ( native) 可 执行 文件 。 在 这 种 情况 下 ， 原 生意 味 
着 它 在 与 编译 器 相同 的 平台 上 运行 ， 而 平台 包括 了 人 硬件、 操作 系 统 、 应 用 程序 二 进 制 接口 
( AB1) 和 系统 接口 等 多 项 选择 的 组 合 。 这 些 选择 定义 了 用 户 级 程序 可 以 用 来 与 底层 系统 通信 
的 机 制 。 因 此 ， 如 果 你 在 GNU/Linux x86 机 器 上 使 用 编译 器 ， 它 将 生成 与 系统 库 链 接 的 可 
执行 文件 ， 并 且 可 以 在 相同 的 平台 上 运行 。 

跨 平 台 编译 是 使 用 编译 器 为 不 同 的 非 原 生平 台 生 成 可 执行 文件 的 过 程 。 如 果 你 要 生成 的 
代码 需要 链接 到 与 你 自己 的 系统 库 不 同 的 其 他 库 ， 通 常 可 以 通过 使 用 特定 的 编译 标志 来 解决 
这 个 问题 。 但 是 ， 如 果 你 打算 部 署 的 可 执行 文件 的 目标 平台 与 你 的 平台 不 兼容 (例如 ， 使 用 
不 同 的 处 理 器 体系 结构 、 操 作 系统 、ABI 或 目标 文件 )， 则 需要 进行 交叉 编译 。 

在 为 资源 有 限 的 系统 开发 应 用 程序 时 ， 交 叉 编 译 器 非常 重要 。 例 如 ， 和 通 人 式 系统 通常 由 
内 存 有 限 和 低 性 能 的 处 理 器 组 成 ， 但 由 于 编译 过 程 是 CPU 和 内 存 密集 型 的 ， 所 以 在 这 样 的 
系统 中 运行 编译 器 会 很 慢 ， 并 且 导 致 研发 周期 很 长 ， 交 又 编译 器 对 于 解决 这 类 问题 至 关 重 
要 。 本 章 将 介绍 以 下 主题 : 

e Clang 和 GCC 交叉 编译 方法 的 比较 

e 什么 是 工具 链 

e 如 何 用 Clang 命令 行进 行 交 叉 编 译 

e 如 何 生 成 并 使 用 自 定义 的 Clang 进行 交叉 编译 

。 测试 目标 二 进 制 文件 的 常见 模拟 器 和 硬件 平台 


8.1 GCC 和 LLVM 对 比 


编译 器 (如 GCC ) 必须 以 特殊 的 配置 进行 构建 才能 支持 交叉 编译 ， 此 外 ， 还 需要 为 每 个 
编译 目标 安装 不 同 的 GCC。 通常 的 做 法 是 在 gcc 命令 前 添加 目标 名 称 作为 前 绥 ， 如 arm- 
gcc 表示 用 于 ARM 的 GCC 交叉 编译 器 。 但 Clang/LLVM 允许 你 通过 Clang 驱动 程序 的 命 
令 行 选项 来 切换 编译 目标 ， 这 些 选 项 包括 编译 目标 、 库 路 径 、 头 文件 、 链 接 器 和 汇编 器 等 。 
因此 一 个 Clang 驱动 程序 适用 于 所 有 目标 。 但 是 ， 出 于 对 可 执行 文件 大 小 等 问题 的 考虑 ， 某 
些 LLVM 分 发 版 本 选择 只 支持 部 分 编译 目标 。 我 们 在 第 1 章 中 说 明了 构建 LLVM 时 如 何 选 
择 想 要 支持 的 编译 目标 。 

GCC 是 一 个 更 悠久 且 较 LLVM 更 为 成 熟 的 项 目 ， 它 支持 超过 50 个 后 端 ， 被 广泛 用 作 这 
些 平台 的 交叉 编译 器 。 但 是 ，GCC 的 设计 存在 限制 ， 它 再 次 安装 的 驱动 程序 只 能 处 理 单个 
编译 目标 的 软件 库 。 这 就 是 必须 通过 不 同 的 GCC 安装 为 其 他 目标 生成 代码 的 原因 。 
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相 比 之 下 ，Clang 驱动 程序 的 默认 构建 过 程 会 编译 所 有 目标 库 并 与 之 链接 。 在 运行 时 ， 
即使 Clang 需要 知道 目标 的 某 些 特性 ， 其 组 件 也 可 以 通过 与 目标 无 关 的 接口 来 访问 由 命令 行 
参数 指定 的 编译 目标 的 任何 信息 。 这 种 方法 使 驱动 程序 能 够 灵活 地 避免 为 每 个 目标 进行 特定 
的 Clang 安装 。 

图 8-1 说 明 LLVM 和 GCC 如 何 为 不 同 的 目标 编译 源 代 码 ， 前 者 可 以 按 需 生成 不 同 处 理 
器 的 代码 ， 而 后 者 需要 针对 每 个 处 理 器 使 用 不 同 的 交叉 编译 器 。 
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你 也 可 以 像 GCC 一 样 构建 专门 的 Clang 交叉 编译 器 驱动 程序 。 这 种 方式 虽然 需要 花费 
时 间 以 构建 一 个 独立 的 Clang/LLVM 安装 包 ， 但 它 也 使 命令 行 界 面 更 简洁 。 在 配置 期 间 ， 用 
户 可 以 为 目标 库 、 头 文件 、 汇 编 器 和 链接 器 提供 固定 路 径 ， 从 而 避免 每 次 交叉 编译 时 都 要 将 
大 量 的 命令 行 选项 传递 给 驱动 程序 。 

在 本 章 中 ， 我 们 将 向 你 展示 如 何 使 用 Clang 驱动 程序 通过 命令 行 选项 为 多 个 平台 生成 代 
码 ， 以 及 如 何 生成 特定 的 Clang 交叉 编译 器 驱动 程序 。 


8.2 目标 三 元 组 介绍 

我 们 将 首先 解释 如 下 三 个 重要 的 定义 : 

e 构建 (Build) 是 指 构建 交叉 编译 器 的 平台 

e 主机 (Host) 是 指 将 运行 交叉 编译 器 的 平台 

e 目标 (Target) 是 指 运行 交叉 编译 器 生成 的 可 执行 文件 或 库 的 平台 

在 标准 的 交叉 编译 器 中 ， 构 建 平台 和 主机 平台 是 相同 的 。 我 们 把 构建 、 主 机 和 目标 平台 
定义 成 目标 三 元 组 ， 以 便 用 处 理 器 体系 结构 、 操 作 系 统 、C 语言 库 类 型 和 目标 文件 类 型 等 相 
关 信 息 唯一 地 标识 各 种 不 同 的 编译 目标 。 

三 元 组 没有 严格 的 格式 ， 例 如 ，GNU 工具 可 以 接受 在 <arch>-<sys/vendor>- 
<other>-<other> 格式 中 由 两 个 、 三 个 甚至 四 个 字段 组 成 的 三 元 组 ， 例 如 arm-1Linux- 


eabi、 mips-linux-gnu、 x86 64-linux-gnu、 x86 64-apple-darwin1l1l 和 
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sparc-elf。Clang 尽量 保持 与 GCC 的 兼容 性 ， 因 此 可 以 识别 上 述 格式 ， 但 是 会 将 它们 规 
范 化 为 它 自己 的 三 元 组 模式 : <arch><sub>-<vendor>-<sys>-<abi>。 

表 8-1 包含 每 个 LLVM 三 元 组 的 每 个 字段 的 可 能 选项 列表 ; 其 中 不 包含 <sub> 字段 ， 
因为 它 代表 体系 结构 的 变种 ， 例 如 armv7 体系 结构 中 的 v7。 有 关 三 元 组 的 细节 ， 请 参阅 
<llvm source>/include/llvm/ADT/Triple.h,。 


表 8-1 LLVM 三 元 组 字段 


体系 结构 (<arch>) 厂商 (<vendor>) 操作 系统 (<sys>) 环境 (<abi>) 
arm, aarch64，hexagony Unknowny unknown, auroraux, unknown, 
mips, mipsel, mips64, apple, pc, cygwin, darwin, gnu, 
mips64el, msp430, scei, bgp, dragonfly, freebsd, gnueabihf, 
ppc, ppc64, ppc64le, bgq, fsl, ios, kfreebsd, linux, gnueabi, 
r600, sparc, sparcv9, ibm, and lv2, macosx, mingw32, gnux32, 
systemz, tce, thumb, nvidia netbsd, openbsd, eabi, macho, 
x86, x86 64, xcore, solaris, win32, haiku, android, and 
nvptx, nvptx64, le32, minix, rtems, nacl, cnk, elf 
amdil, spir, and bitrig, aix, cuda, and 
spir64 nvel 


请 注意 ， 并 非 arch、vendor、sys 和 abi 的 所 有 组 合 都 是 有 效 的 。 每 个 体系 结构 都 
支持 一 组 有 限 的 组 合 。 

图 8-2 说 明 构 建 且 运行 于 x86 上 并 生成 ARM 可 执行 文件 的 ARM 交叉 编译 器 的 概念 。 
好 奇 的 读者 可 能 会 问 ， 如 果 主 机 和 构建 平台 不 同 会 发 生 什么 。 这 种 情况 下 的 编译 器 称 为 
Canadian 交叉 编译 器 ， 其 过 程 更 为 复杂 ， 需 要 将 下 图 深 色 框 中 的 编译 器 替换 成 另外 一 个 交叉 
编译 器 (而 非 原生 编译 器 )。Canadian 交叉 编译 器 的 名 称 来 源 于 该 编译 器 刚 被 发 明 时 加 拿 大 
政府 有 三 个 政党 ， 该 编译 器 使 用 三 个 不 同 的 平台 。Canadian 交叉 编译 器 最 为 典型 的 应 用 是 开 
发 者 想 为 其 他 用 户 分 发 交叉 编译 器 ， 并 且 和 希望 支持 除 自 身 开 发 环境 以 外 的 平台 。 








x86_64-linux-gnu x86_64-linux-gnu arm-linux-eabi 


ARM 
可 执行 文件 








8.3 准备 自己 的 工具 链 
编译 器 这 一 术语 隐 含 了 一 个 与 编译 相关 的 任务 集合 ， 这 些 任务 由 前 端 、 后 端 、 汇 编 器 和 


跑 亚 台 编 译 143 


链接 器 等 不 同 组 件 执行 。 其 中 一 些 任务 由 独立 的 工具 完成 ， 而 其 他 任务 集成 在 编译 器 内 部 。 
但 是 ， 在 开发 原生 的 或 用 于 任何 其 他 目标 的 应 用 程序 时 ， 开 发 人 员 需 要 更 多 的 资源 和 功能 ， 
例如 平台 相关 的 库 、 调 试 器 和 读 取 目 标 文件 的 工具 等 。 因 此 ， 各 平台 厂商 通常 会 在 其 平台 上 
分 发 一 套 软件 开发 工具 ， 为 客户 提供 相应 的 开发 工具 链 。 

了 解 工具 链 组 件 以 及 它们 如 何 相互 交互 ， 对 于 生成 或 使 用 交叉 编译 器 是 非常 重要 的 。 
图 8-3 显示 成 功 交叉 编译 所 需 的 主要 工具 链 组 件 ， 下 面 的 小 节 将 对 每 个 组 件 进行 描述 。 


glibc、 ie 
目标 三 元 组 路 径 : ~ 
库 文件 、 头 文件 、 ”特定 于 目标 的 民 和 文件 GE 
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i pp 运行 时 
， compiler-rt 、 
Uy 库 E libgcc 
7 用 
7 丁 
pb 全 
汇编 器 链接 器 
GNU as、Apple GNU as、Apple 
cctools、 Id cctools Id、1ld 








图 8-3 


8.3.1 标准 C/C++ 库 


C 语言 库 是 支持 诸如 内 存 分 配 (malloc()/free())、 字 符 串 处 理 ( strcmp()) 和 JI 

O (printf()/scanf()) 等 标准 C 语言 功能 所 必需 的 。 常 见 的 C 库 头 文件 包括 stdio. 
h、stdlib.h 和 string.h。C 语 言 库 有 多 种 实现 ， 例 如 GNU C 库 (glibc)、newlib 
和 uclibc 等 。 这 些 库 支持 不 同 的 目标 机 器 ， 并 且 可 以 移植 到 新 的 目标 机 器 。 

同样 ,C++ 标准 库 实 现 了 C++ 语言 功能 ， 如 输入 输出 流 、 容 器 、 字 符 串 处 理 和 线程 支持 
等 。GNU 的 libstdc++ 和 LLVM 的 Libc++ (参见 http://1ibcxx.11lvm.org) 都 是 
C++ 标准 库 的 实现 。 实 际 上 ， 完 整 的 GNU C++ 库 包含 libstdc++ 和 1ibsupC++。 后 者 
是 协助 移植 的 目标 相关 层 ， 只 用 于 异常 处 理 和 RTTI。 除 Mac OS XX 以 外 , LLVM 的 Libc++ 
实现 仍然 依赖 于 第 三 方 实现 的 1ibsupc++ 的 替代 版 本 (请 参阅 第 2 章 中 介绍 libC++ 标准 
库 部 分 的 内 容 ， 以 获得 详细 信息 ) 。 

交叉 编译 器 需要 知道 目标 C/C++ 库 和 头 文件 的 路 径 ， 以 便 搜索 正确 的 函数 原型 ， 并 在 
随后 进行 适当 的 链接 。 正 确 匹 配 头 文件 和 库 文 件 的 版 本 和 实现 非常 重要 ， 和 否则 错误 配置 的 交 
又 编译 器 可 能 会 寻找 原生 系统 头 文件 ， 导 致 编译 错误 。 


8.3.2 运行 时 库 
每 个 目标 都 需要 使 用 特殊 函数 来 模拟 本 地 不 支持 的 低级 操作 。 例 如 ，32 位 机 器 通常 没 
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有 64 位 的 寄存 器 ， 所 以 无 法 直接 使 用 64 位 类 型 。 因 此 ， 编 译 器 可 以 使 用 两 个 32 位 寄存 器 
并 调用 特定 的 函数 来 执行 简单 的 算术 运算 (加 法 、 减 法 、 乘 法 和 除法 )。 

代码 生成 器 会 生成 对 这 些 函 数 的 调用 ， 并 期 望 它 们 在 链接 时 被 找到 。 驱 动 程序 (而 不 
是 用 户 ) 必须 为 此 提供 必要 的 库 。 在 GCC 中 ， 这 个 功能 在 运行 时 库 1ibgcc 中 实现 。 而 
LLVM 提供 了 一 个 名 为 compiler-rt 的 等 效 库 (请 参阅 第 2 章 )。 因 此 ，Clang 驱动 程序 
使 用 -lgcc 或 -lclang rt (与 compiler-rt 链接 ) 调用 链接 器 。 同 样 ， 特 定 于 目标 的 
运行 时 库 必 须 位 于 路 径 中 才能 被 正确 链接 。 


8.3.3 汇编 器 和 链接 器 


汇编 器 和 链接 顺 通 常 作为 独立 的 工具 ， 由 编译 器 驱动 程序 调用 。 例 如 GNU Binutils 提 
供 的 汇编 器 和 链接 器 支持 多 个 目标 ， 如 果 编 译 原生 目标 ， 通常 可 以 在 系统 路 径 中 找到 as 和 
ld 工具。 还 有 一 个 基于 LLVM 但 仍然 处 于 实验 阶段 的 链接 器 ， 称 为 11a (http://11d. 
llvm.org)。 

调用 这 些 工 具 需 要 在 汇编 器 和 链接 器 的 名 称 前 级 中 使 用 目标 三 元 组 ， 并 能 在 系统 的 
PATH 变量 中 查找 到 。 例 如 ， 为 mips-Linux-gnu 生成 代码 时 ， 了 驱动 程序 可 以 搜索 mips- 
linux-gnu-as 和 mips-linux-gnu-1d。 取 决 于 目标 三 元 组 信息 ，Clang 搜索 的 方式 可 
能 各 不 相同 。 

在 Clang 中 ， 有 些 目 标 不 需要 调用 外 部 汇编 器 。 因 为 LLVM 通过 MC 层 直 接 提供 代码 
输出 功能 ， 驱 动 程序 可 以 通过 -integrated-as 选项 直接 调用 集成 的 MC 汇编 器 ， 该 选项 
对 某 些 目标 是 默认 开启 的 。 


8.3.4 _ Clang 前 端 


在 第 5 章 ， 我 们 解释 了 由 于 C/C++ 语言 并 非 目 标 独立 的 ， 因 而 Clang 生成 的 LLVM IR 
也 不 是 目标 独立 的 。 除 后 端 以 外 ， 前 端 还 必须 遵循 特定 于 目标 的 约束 条 件 。 因 此 你 必须 清 
楚 ， 尽 管 Clang 可 以 支持 特定 处 理 器 ， 但 如 果 编 译 目标 的 三 元 组 信息 无 法 严格 匹配 该 处 理 
器 ， 则 前 端 可 能 生成 不 完善 的 LLVM IR， 从 而 可 能 导致 ABI 不 匹配 和 运行 错误 。 

Multilib 

Mnultilib 是 一 个 解决 方案 ， 它 允许 用 户 在 同一 平台 上 运行 针对 不 同 ABI 编译 的 应 用 程 
序 。 该 方案 可 以 避免 一 个 交叉 编译 器 只 能 针对 一 个 ABI 的 问题 ， 使 得 一 个 交叉 编译 器 可 以 
访问 对 应 多 个 ABI 版 本 的 库 和 头 文件 。 例 如 ，mnultilib 允许 软 浮 点 和 硬 浮 点 库 共存 ， 即 依靠 
浮 点 运算 的 软件 仿真 的 库 和 依赖 处 理 器 FPU 来 处 理 浮 点 数 的 库 。GCC 对 于 每 个 multilib 版 
本 都 有 几 个 1ibc 和 1ibgcc 版 本 。 

例如 ， 在 MIPS GCC 中 ，maultilib 库 文件 夹 结构 如 下 : 

e 1ib/n32: 该 文件 夹 包含 n32 库 ， 支 持 n32 MIPS ABI。 

e 1ib/n32/EL: 该 文件 夹 包含 小 端 字 节 序 版 本 的 Libgcc、1Libc 和 1ibstdC++。 

e 1ib/n32/msoft-float: 该 文件 夹 包含 n32 的 软 浮 点 库 。 
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e 1ib/n64: 该 文件 夹 包 含 n64 库 ， 支 持 n64 MIPS ABI。 

e 1ib/n64/EL: 该 文件 夹 包 含 小 端 字 节 序 版 本 的 1ibgcc、1libc 和 1ibstdCc++。 

e 1ib/n64/msoft-float: 该 文件 夹 包含 n064 软 浮 点 库 。 

只 要 为 库 和 头 文件 提供 了 正确 的 路 径 ，Clang 就 能 支持 multilib 环境 。 但 由 于 前 端 可 能 
为 某 些 目标 中 的 不 同 ABI 生成 不 同 的 LLVM IR， 因 此 最 好 仔细 检查 路 径 和 目标 三 元 组 ， 以 
确保 匹配 ， 避 免 运行 错误 。 


8.4 用 Clang 命令 行 参数 进行 交叉 编译 
前 面 我 们 已 经 介绍 了 工具 链 中 的 每 个 组 件 ， 接 下 来 我 们 将 展示 如 何 通过 使 用 适当 的 驱动 
程序 参数 将 Clang 作为 交叉 编译 器 使 用 。 


& 本 节 中 的 所 有 示例 都 在 运行 Ubuntu 12.04 的 x86 64 机 器 上 进行 过 测试 。 我 们 使 
-一 用 Ubuntu 自 带 的 工具 下 载 了 一 些 依赖 项 ， 但 是 与 Clang 相关 的 命令 应 该 可 以 在 
没有 (或 轻微 ) 修改 的 情况 下 在 其 他 任意 OS 环境 中 使 用 。 


8.4.1 针对 目标 的 驱动 程序 选项 

Clang 使 用 -target=<triple> 驱动 程序 选项 来 动态 选择 生成 代码 所 需 的 目标 三 元 
组 。 除 了 三 元 组 之 外 ， 还 可 以 使 用 其 他 选项 来 更 精确 地 选择 目标 : 

e -march=<arch> 选项 用 于 选择 目标 处 理 絮 架构 。<arch> 值 的 示例 包括 ARM 的 

armv4t、armv6、armv7 和 armv7f, 以 及 MIPS 的 mips32、mips32r2、mips64 
和 mips64r2。 仅 声明 此 选项 会 选择 代码 生成 器 中 默认 的 基础 CPU。 

e -mcpu=<cpu> 选项 用 于 选择 特定 的 CPU。 例 如 ，cortex-m3 和 cortex-a8 是 

ARM 特 定 的 CPU, pentium4、athlon64 和 corei7avx2 是 x86 CPU。 每 个 
CPU 都 有 由 目标 定义 并 被 驱动 程序 使 用 的 基础 <arch> 值 。 
-mfloat-abi=<abi> 选项 用 于 选择 使 用 哪 种 类 型 的 寄存 器 来 保存 浮 点 值 : soft 
或 hard。 如 前 所 述 ， 这 决定 了 是 否 使 用 软件 浮 点 模拟 。 它 还 隐 含 在 调用 惯例 和 其 他 
ABI 规范 上 的 变化 。-msoft-float 和 -mhard-float 选项 都 有 对 应 的 别名 。 如 果 
未 指定 ， 则 ABI 类 型 将 符合 所 选 CPU 的 默认 类 型 。 

使 用 clang --help-hidden 可 以 查看 其 他 目标 相关 的 选项 ， 它 会 向 你 展示 原始 帮助 
消息 中 隐藏 的 选项 。 


8.4.2 依赖 包 


我 们 将 使 用 ARM 交叉 编译 器 作为 运行 示例 ， 来 演示 如 何 使 用 Clang 进行 交叉 编译 。 第 
一 步 是 在 你 的 系统 中 安装 完整 的 ARM 工具 链 ， 并 识别 所 提供 的 组 件 。 
要 使 用 硬 浮 点 ABI 为 ARM 安装 GCC 交叉 编译 器 ， 请 使 用 以 下 命令 : 


$ apt-get install g++-4.6-arm-linux-gnueabihf gcc-4.6-arm-linux-gnueabihf 
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要 使 用 软 浮 点 ABI 为 ARM 安装 GCC 交叉 编译 器 ， 请 使 用 以 下 命令 : 


$ apt-get install g++-4.6-arm-linux-gnueabi gcc-4.6-arm-linux-gnueabi 


我 们 刚刚 要 求 你 安装 一 个 包括 交叉 编译 器 在 内 的 完整 GCC 工具 链 ! 为 什么 需要 
它 呢 ? 正如 在 工具 链 部 分 所 解释 的 那样 ， 在 交叉 编译 过 程 中 ， 编 译 器 本 身 就 像 一 
个 小 部 件 ， 而 其 他 组 件 包括 汇编 器 、 链 接 器 和 目标 库 等 。 你 应 该 使 用 由 你 的 目标 
平台 供应 商 准 备 的 工具 链 ， 因 为 它 能 提供 正确 的 头 文件 和 链接 库 。 尽 管 我们 想 要 
使 用 Clang/LLVM， 但 是 我 们 的 工作 仍然 依赖 于 所 有 其 他 工具 链 组 件 。 这 个 工具 
链 通 常情 况 下 会 与 GCC 编译 器 一 起 分 发 。 

如 果 你 想 自行 构建 所 有 的 目标 相关 库 并 准备 整个 工具 链 ， 还 需要 准备 一 个 操作 系 
统 映像 来 启动 目标 平台 。 如 果 你 自行 构建 系统 映像 和 工具 链 ， 必 须 保证 两 者 都 与 
目标 系统 中 使 用 的 库 的 版 本 一 致 。 如 果 你 喜欢 从 零 开始 构建 项 目 ， 那 么 可 以 参与 
跨 Linux 从 零 开始 教程 ， 它 位 于 http://trac.cross-lfs.org。 


虽然 apt-get 会 自动 安装 工具 链 的 依赖 包 ， 但 基于 Clang 的 C/C++ ARM 交叉 编译 需 
所 需要 和 推荐 的 基本 包 如 下 : 

e libc6-dev-armhf-cross 和 libc6-dev-armel-cross 

egcc-4.6-arm-linux-gnueabi-base 和 gcc-4.6-arm-linux- 

gnueabihfbase 

e binutils-arm-linux-gnueabi 和 binutils-arm-linux-gnueabihf 

® libgccl-armel-cross 和 1libgccl-armhf-cross 

e libstdC++ 6-4.6-dev-armel-cross 和 1libstdC++ 6-4.6-dev-armhf- 


cross 


8.4.3 ”交叉 编译 


尽管 我 们 对 GCC 交叉 编译 咒 本 身 不 感 兴趣 ,但 是 我 们 通过 上 一 节 的 命令 安装 了 我 们 的 
交叉 编译 器 所 需 的 必要 先决 条 件 : 链接 器 、 汇 编 器 、 库 和 头 文件 。 之 后 ， 可 以 使 用 以 下 命令 
为 arm-1Linux-gnueabihf 平 台 编译 第 7 章 中 的 sum.c 程序 : 


$ clang --target=arm-linux-gnueabihf sum.c -Oo sum 
$ file sum 


sum: ELF 32-bit LSB executable, ARM, version 1 (SYSV), dynamically linked 
(uses shared libs)... 


Clang 从 GNU 的 arm-linux-gnueabihf 工 具 链 中 找到 所 有 必要 的 组 件 ， 并 生 
成 最 终 的 可 执行 文件 。 在 这 个 例子 中 ， 所 使 用 的 默认 架构 是 armv6， 但 我 们 可 以 提供 
--target 值 进行 更 具体 的 指定 ， 并 使 用 -mcpu 值 生成 更 精确 的 代码 : 


$ clang --target=armv7a-linux-gnueabihf -mcpu=cortex-al5 sum.c -Oo sum 
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8.4.3.1 安装 GCC 
Clang 使 用 --target 选项 提供 的 目标 三 元 组 来 搜索 具有 相同 或 类 似 前 级 的 GCC 安 
装 。 如 果 找 到 多 个 候选 项 ，Clang 会 选择 与 目标 最 接近 的 版 本 : 


$ clang --target=arm-linux-gnueabihf sum.c -Oo sum -V 

clang version 3.4 (tags/RELEASE 34/final) 

Target: arm--linux-gnueabihf 

Thread model: posix 

Found candidate GCC installation: /usr/lib/gcc/arm-linux-gnueabihf/4.6 

Found candidate GCC installation: /usr/lib/gcc/arm-linux-gnueabihf/4.6.3 

Selected GCC installation: /usr/lib/gcc/arm-linux-gnueabihf/4.6 

pe 

由 于 GCC 安装 通常 带 有 汇编 器 、 链 接 器 、 库 和 头 文件 ， 因 此 Clang 使 用 它 来 获得 所 需 
的 工具 链 组 件 。 如 果 已 经 知道 系统 中 已 安装 工具 链 的 准确 名 称 ， 并 通过 三 元 组 的 形式 将 其 提 
供给 Clang 驱动 程序 ， 后 者 就 可 以 直接 获得 对 应 工具 的 路 径 。 但 如 果 我 们 提供 了 一 个 不 匹配 
或 不 完整 的 三 元 组 ， 驱 动 程序 将 搜索 并 选择 它 认 为 最 匹配 的 设置 : 


$ clang --target=arm-linux sum.c -oO sum -Vv 


a Gcc installation: /usr/lib/gcc/arm-linux-gnueabi/4.7 

clang: warning: unknown platform, assuming -mfloat-abi=soft 

请 注意 ， 尽 管 我 们 为 arm-linux-gnueabi 和 armlinux-gnueabihf 安装 了 GCC 
工具 链 ， 但 驱动 程序 会 选择 前 者 。 在 上 述 例 子 中 ， 由 于 命令 行 选项 并 未 指定 平台 参数 ， 因 此 
clang 使 用 默认 参数 ， 即 soft-float ABI。 

8.4.3.2 ”潜在 问题 

如 果 我 们 添加 -mfloat-abi=hard 选项 ， 驱 动 程序 将 忽略 警告 信息 ， 但 会 一 直选 择 
arm-linux-gnueabi 而 不 是 arm-linux-gnueabihf。 这 种 方式 下 最 终生 成 的 可 执行 
文件 可 能 导致 一 个 运行 时 错误 ， 因 为 硬 浮 点 目标 平台 会 与 软 浮 点 平台 对 应 的 库 链 接 : 


$ clang --target=arm-linux -mfloat-abi=hard sum.c -Oo sum 


即使 我 们 使 用 -foat-abi=hard 参数 ， 但 Clang 仍然 不 会 选择 arm-linux-gnuebihf 
平台 ,这 是 因为 我 们 没有 明确 要 求 Clang 使 用 arm-linux-gnueabihf 工具 链 。 如 果 让 
驱动 程序 自由 选择 ， 它 会 选择 它 自 己 发 现 的 第 一 个 工具 链 ， 即 使 该 工具 链 可 能 是 不 匹配 的 。 
该 例子 旨 在 说 明 一 个 重要 的 问题 : 如 果 你 使 用 一 个 模糊 或 不 完整 的 目标 三 元 组 (比如 arm- 
linux)， 那 么 驱动 程序 的 默认 选择 可 能 不 是 最 佳 的 。 

因此 ， 知 晓 正在 使 用 的 底层 工具 链 组 件 是 非常 重要 的 ， 这样 可 以 确保 使 用 正确 的 工具 链 ， 
例如 ， 可 以 使 用 -### 标志 来 打印 Clang 调用 了 哪些 工具 来 完成 编译 、 汇 编 和 链接 过 程 。 

下 面 做 一 个 小 实验 ， 即 提供 更 含糊 的 目标 三 元 组 信息 ， 看 看 会 发 生 什 么 ， 我 们 只 使 
用 --target=arm 选项 : 

$ clang --target=arm sum.c -oOo sum 


/tmp/sum-3bbfbc.s: Assembler messages: 
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/tmp/sum-3bbfbc.s:1: Error: Unknown pseudo-op: “~.SYyntax' 

/tmp/sum-3bbfbc.s:2: Error: unknown pseudo-op: “~ .cpu! 

/tmp/sum-3bbfbc.s:3: Error: unknown pseudo-op: “ .eabi attribute' 

Cinn) 

上 述 示例 代码 从 三 元 组 中 删除 了 操作 系统 信息 ， 导 致 驱动 程序 出 现 混乱 和 编译 错误 。 驱 
动 程序 试图 通过 使 用 原生 ( x86_64 ) 汇编 器 来 汇编 ARM 汇编 语言 。 由 于 目标 三 元 组 严重 不 
完整 ， 并 且 操 作 系 统 信息 缺失 ，arm-1Linux 工具 链 无 法 匹配 驱动 程序 的 需求 ， 导 致 驱动 程 
序 决 定 使 用 系统 汇编 器 。 


8.4.4 更 改 系统 根 目录 


驱动 程序 能 够 自动 获取 支持 目标 平台 的 工具 链 ， 方 法 是 使 用 给 出 的 三 元 组 信息 ， 以 及 它 
扫描 GCC 安装 目录 所 获得 的 已 知 前 级 的 列表 ， 在 系统 中 检查 是 否 有 GCC 交叉 编译 器 (请 参 
阅 <llvm_source>/tools/clang/lib/Driver/ToolChains.cpp), 

在 其 他 情况 下 ， 例 如 三 元 组 格式 错误 或 GCC 交叉 编译 器 未 安装 等 ， 必 须 将 特殊 选项 传 
递 给 驱动 程序 ， 以 使 用 可 用 的 工具 链 组 件 。 例 如 ，--sysroot 选项 可 以 更 改 Clang 搜索 工 
具 链 组 件 的 根 目录 ， 该 选项 可 以 在 目标 三 元 组 没有 提供 足够 的 信息 时 使 用 。 此 外 ， 也 可 以 使 
用 --gcc-toolchain=<value> 选项 指定 要 使 用 的 特定 工具 链 的 文件 夹 。 

对 于 系统 中 安装 的 ARM 工具 链 ，arm-linux-gnueabi 三 元 组 选择 的 GCC 安装 路 
径 是 /usr/lib/gcc/arm-linux-gnueabi/4.6.3。Clang 能够 通过 该 目录 访问 库 、 
头 文件 、 汇 编 器 和 链接 器 的 其 他 路 径 。 其 中 一 个 它 能 访问 的 路 径 是 /usr/arm-linux- 
gnueabi， 该 路 径 包 含 以 下 子 目录 : 


$ ls /usr/arm-linux-gnueabi 
bin include 1lib usr 


可 以 看 到 ， 在 这 些 文件 夹 中 工具 链 组 件 的 组 织 方式 与 本 地 文件 系统 的 /bin、/include、 
/Lib 和 /usr 相同 。 假 设 现在 我 们 想 在 cortex A9 CPU 上 为 armv7-linux 生成 代码 ， 
而 且 不 依靠 驱动 程序 自动 找到 组 件 。 只 要 我 们 知道 arm-1Linux-gnueabi 组 件 的 位 置 ， 就 
可 以 提供 一 个 --sroot 标志 给 驱动 程序 : 

$ PATH=/usr/arm-linux-gnueabi/bin:$PATH /p/cross/bin/clang 


--target=armv7a-linux --sysroot=/usr/arm-linux-gnueabi -mcpu=cortex-a9 
-mfloat-abi=soft sum.c -oO sum 


同样 ， 上 述 方法 非常 有 用 ， 尤 其 是 当 所 需 的 工具 链 组 件 可 用 但 并 没有 可 靠 的 GCC 安装 
时 。 该 方法 行 之 有 效 的 原因 主要 有 三 个 : 
e armv7a-linux:armv7a 三 元 组 激活 了 ARM 和 Linux 的 代码 生成 。 除 此 之 外 ， 它 
还 告诉 驱动 程序 使 用 GNU 汇编 器 和 链接 器 的 调用 语法 。 如 果 没 有 指定 操作 系统 ， 
Clang 默认 使 用 Darwin 汇编 絮语 法 ， 由 此 产生 汇编 错误 。 
e /usr、/1ib 和 /usr/include 文件 夹 是 编译 器 默认 搜索 库 和 头 文件 的 位 置 。-- 
sysroot 选项 将 覆盖 此 默认 路 径 ， 以 使 用 /usr/arm-1linux-gnueabi 下 的 目录 。 
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e 更 改 了 PATH 环境 变量 ， 从 而 避免 使 用 默认 版 本 的 as 和 1d。 然 后 ， 我 们 强制 驱动 
程序 首先 搜索 包含 ARM 版 本 as 和 1d 的 /usr/armlinux-gnueabi/bin 路 径 。 


8.5 生成 Clang 交叉 编译 器 


前 面 提 到 ，Clang 动态 支持 为 任何 目标 生成 代码 。 但 是 ， 可 能 有 如 下 原因 需要 生成 目标 
专用 的 Clang 交叉 编译 克 : 

e 用 户 希 望 避 免 使 用 长 命令 行 来 调用 驱动 程序 

e 制造 商 希望 将 基于 Clang 的 特定 于 平台 的 工具 链 交 付 给 客户 


8.5.1 配置 选项 


LLVM 配置 系统 有 以 下 选项 可 帮助 生成 交叉 编译 器 : 
e --target : 此 选项 指定 Clang 交叉 编译 器 为 其 生成 代码 的 默认 目标 三 元 组 。 该 三 元 
组 与 我 们 之 前 定义 的 目标 、 主 机 和 构建 的 概念 有 关 。--host 和 --build 选项 也 是 
可 用 的 ， 但 配置 脚本 可 以 推测 出 它们 都 是 指 原生 平台 。 
--enable-targets : 此 选项 指定 本 次 安装 所 支持 的 编译 目标 。 如 果 缺 省 ， 则 支持 
所 有 目标 。 请 记 住 ， 必 须 使 用 前 面 介 绍 的 命令 行 选 项 ( --target)， 才 能 使 用 不 同 
于 默认 值 的 编译 目标 。 
--with-c-include-dirs : 这 个 选项 指定 交叉 编译 器 用 来 搜索 头 文件 的 目录 列 
表 。 使 用 此 选项 可 以 避免 频繁 使 用 - 工 来 定位 可 能 不 在 规范 路 径 内 的 特定 目标 库 。 另 
外 ， 这 些 目 录 的 搜索 顺序 排 在 系统 默认 目录 之 前 。 
--with-gcc-toolchain : 该 选项 指定 系统 中 已 经 安装 好 的 对 应 编译 目标 的 GCC 
工具 链 。 这 个 选项 用 于 定位 工具 链 组 件 ， 它 被 硬 编码 于 交叉 编译 器 中 ， 功 能 等 同 于 
一 个 永久 的 --gcctoolchain 选项 。 
--with-default-sysroot : 此 选项 将 --sysroot 选项 添加 到 由 交叉 编译 器 执 
行 的 所 有 编译 器 调用 中 。 

有 关 所 有 LLVM/Clang 配置 选项 ， 请 参阅 <llvm_source>/configure --help。 
可 以 使 用 额外 的 配置 选项 (隐藏 选项 ) 来 搜索 特定 于 目标 的 特征 ， 例 如 --with-cpu、-- 
with-float, --with-abi 和 --with-fpu。 


8.5.2 构建 和 安装 基于 Clang 的 交叉 编译 器 


构建 、 编 译 和 安装 交叉 编译 器 的 指令 与 第 1 章 中 介绍 的 编译 LLVM 和 Clang 的 方法 非 
常 相似 。 因 此 ， 假 设 源 代 码 已 经 就 位 ， 读 者 可 以 使 用 以 下 命令 生成 一 个 默认 针对 Cortex-A9 
的 LLYM ARM 交叉 编译 器 : 


$ cd <llvm build dir> 


$ <PATH TO SOURCE>/configure --enable-targets=arm --disable-optimized 
--prefix=/usr/local/llvm-arm --target=armv7a-unknown-linux-gnueabi 
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$ make && sudo make install 

$ export PATH=$PATH:/usr/local/llvm-arm 

$ armv7a-unknown-linux-gnueabi-clang sum.c -co sum 
$ file sum 


Sum: ELF 32-bit LSB executable, ARM, version 1 (SYSV), dynamically linked 
(uses shared libs)... 


回想 一 下 介绍 目标 三 元 组 的 内 容 ， 兼容 GCC 的 目标 三 元 组 最 多 可 以 有 四 个 元 素 ， 但 是 
有 些 工 具 接受 三 个 或 者 更 少 。LLVM 使 用 的 配置 脚本 由 GNU 工具 自动 生成 ， 它 期 望 目标 信 
息 包含 全 部 四 个 元 素 ， 并 且 在 第 二 元 素 中 含有 供应 商 信息 。 由 于 我 们 的 平台 没有 具体 的 供应 
商 ， 所 以 我 们 把 三 元 组 扩展 为 armv7a-unknown-1inux-gnueabi。 如 果 在 这 里 我 们 坚 
持 使 用 包含 三 个 元 素 的 三 元 组 ， 配 置 脚本 将 会 失败 。 

由 于 Clang 会 查找 GCC 安装 路 径 ， 因 此 不 需要 其 他 选项 来 检测 工具 链 。 

假设 你 分 别 在 /opt/arm-extra-libs/include 和 /opt/arm-extra-libs/lib 
目录 中 编译 并 安装 额外 的 ARM 库 和 头 文件 。 通 过 使 用 --with-c-include-dirs =/ 
opt/arm-extra-libs/include 命令 ， 可 以 将 这 个 目录 永久 地 添加 到 Clang 头 文件 搜索 
路 径 ， 注 意 ， 仍 然 需要 添加 -L/opt/arm-extra-libs/1ib 才 能 进行 正确 的 链接 。 

$ <PATH TO SOURCE>/configure --enable-targets=arm --disable-optimized 


--prefix=/usr/local/llvm-arm --target=armv7a-unknown-linux-gnueabi 
--with-c-include-dirs=/opt/arm-extra-libs/include 


8.5.3 ”其 他 构建 方法 


还 有 其 他 工具 可 以 用 来 生成 基于 LLVM/Clang 的 工具 链 ， 也 可 以 使 用 LLVM 的 其 他 构 
建 系统 。 另 一 种 替代 方法 是 创建 一 个 包装 层 来 封装 整个 过 程 。 

8.5.3.1 Ninja 

生成 交叉 编译 器 的 另 一 种 方法 是 使 用 CMake 和 Ninja。 后 者 是 一 个 为 小 型 快速 项 目 设 计 
的 构建 系统 。 

除了 传统 的 配置 和 构建 交叉 编译 器 的 步骤 外 ， 还 可 以 使 用 特殊 的 CMake 选项 为 Ninja 
生成 合适 的 构建 指令 ， 然 后 用 它 构 建 并 安装 对 应 编译 目标 的 交叉 编译 器 。 

http://llvm.org/docs/HowToCrossCompileLLVM.html 提供 了 有 关 如 何 使 用 
此 方法 的 说 明和 文档 。 

8.5:3.2 ‘ELLCC 

ELLCC 工具 是 一 个 基于 LLVM 的 框架 ,用 于 为 嵌入 式 目 标 生成 工具 链 。 

ELLCC 的 设计 目标 是 创建 一 个 帮助 生成 和 使 用 交叉 编译 器 的 简单 工具 。ELLCC 工具 是 
可 扩展 的 ， 支 持 新 的 目标 配置 ， 并且 易于 被 开发 人 员 使 用 。 

ELLCC 还 会 编译 和 安装 几 个 工具 链 组 件 ， 包 括 用 于 平台 测试 的 调试 器 和 QEMU (如 果 
可 用 )。 

ecc 工具 是 可 以 使 用 的 最 终 交叉 编译 器 。 它 在 Clang 交叉 编译 器 上 创建 一 个 使 用 层 ， 并 
接受 与 GCC 和 Clang 兼容 的 命令 行 选 项 来 编译 任何 支持 的 目标 。 可 以 在 http://ellcc . 
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org/ 上 阅读 更 多 信息 。 

8.5.3.3 ”Emb 工具 包 

能 人 式 系 统 工具 包 是 用 于 为 戏 人 式 系统 生成 工具 链 的 另 一 个 框架 。 它 可 以 编译 其 组 件 并 
同时 提供 一 个 根 文件 系统 ， 还 可 以 生成 基于 Clang 或 LLVM 的 工具 链 。 

它 提 供 ncurses 和 用 于 组 件 选 择 的 GUI 界面。 可 以 在 https://www.embtoolkit. 
org/ 上 找到 更 多 的 细节 。 


8.6 测试 
要 测试 交叉 编译 是 否 成 功 ， 最 合理 的 方法 通常 是 在 真实 的 目标 平台 上 运行 编译 生成 的 可 
执行 文件 。 但 是 ， 如 果实 际 目标 不 可 用 或 无 法 获取 ， 则 可 以 使 用 某 些 模拟 器 来 测试 程序 。 


8.6.1 开发 板 


现在 有 多 种 平台 的 开发 板 ， 可 以 在 网 上 以 合理 价格 购买 。 例 如 ， 你 可 以 找到 从 简单 的 
Cortex-M 系列 处 理 需 到 多 核 Cortex-A 系列 处 理 器 的 ARM 开发 板 。 
尽管 这 些 开发 板 上 的 外 设 组 件 不 尽 相 同 ， 但 它们 基本 都 会 配置 以 太 网 、Wi-Fi、USB、 
存储 卡 等 外 设 。 因 此 ， 交 又 编译 生成 的 应 用 程序 可 以 通过 网 络 、USB 发 送 ， 也 可 以 写 人 闪 
存 卡 ， 并 在 未 安装 操作 系统 或 者 安装 了 奶 人 式 Linux/FreeBSD 操作 系统 的 开发 板 上 执行 。 
此 类 开发 板 的 例子 见 表 8-2: 
表 8-2 开发 板 的 例子 


名 称 功能 架构 / 处 理 器 链接 
Panda Board Linux, ARM, 双核 http://pandaboard.org/ 
Android, Cortex A9 
Ubuntu 
Beagle Board Linux, ARM, Cortex A8 http://beagleboard.org/ 
Android ， 
Ubuntu 
SEAD-3 Linux MIPS M14K http://www.timesys.com/supported/processors/mips 
Carambola-2 Linux MIPS 24K http://8devices.com/carambola-2 


还 有 大 量 的 移动 电话 搭载 ARM 和 MIPS 处 理 器 并 运行 Android， 它们 都 有 可 用 的 开发 
工具 包 ， 也 可 以 在 这 些 设备 上 尝试 Clang。 


8.6.2 ”模拟 器 


一 般 而 言 ， 制 造 商 都 会 为 其 处 理 器 开发 模拟 器 ， 因 为 软件 开发 周期 在 实际 平台 准备 就 绪 
之 前 就 已 经 开始 了 。 因 此 ， 带 模拟 器 的 工具 链 会 被 分 发 给 客户 或 用 于 内 部 产品 测试 。 

一 种 测试 交叉 编译 程序 的 方法 是 利用 这 些 制造 商 提供 的 环境 。 不 过 ， 特 定 的 架构 和 处 理 
器 也 有 一 系列 开源 模拟 器 。QEMTU 就 是 一 种 支持 用 户 和 系统 仿真 的 开源 模拟 器 。 

在 用 户 模拟 模式 下 ，QEMU 能 够 在 当前 平台 上 模拟 为 其 他 目标 编译 的 独立 可 执行 文件 。 
例如 ， 前 面 提 到 的 用 Clang 编译 并 链接 的 ARM 可 执行 文件 很 可 能 可 以 在 ARM-QEMU 用 户 
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模拟 器 中 直接 运行 。 

系统 模拟 器 可 以 再 现 整 个 系统 的 行为 ， 包 括 外 围 设备 和 多 处 理 器 。 由 于 完整 的 启动 过 程 
是 模拟 的 ， 因 此 需要 一 个 操作 系统 。QEMU 可 以 模拟 一 个 完整 的 开发 板 ， 因 此 它 也 是 裸 机 
测试 或 与 外 设 交 互 测试 的 理想 选择 。 

QEMU 支持 不 同 版 本 的 ARM、MIPS、OpenRISC、SPARC、Alpha 和 MicroBlaze 等 处 
理 器 架构 ， 可 以 通过 http://demu-project.org 阅读 更 多 信息 。 


8.7 ”其 他 资源 
官方 Clang 文档 包含 有 关 使 用 Clang 作为 交叉 编译 器 的 相关 信息 ， 请 参阅 http:// 


clang.llvm.org/docs/CrossCompilation.html,。 


8.8 总 结 


交叉 编译 器 是 为 其 他 平台 开发 应 用 程序 的 重要 工具 。Clang 能 够 非常 方便 地 支持 交叉 编 
译 ， 并且 其 驱动 程序 支持 编译 目标 的 动态 选择 。 

在 本 章 中 ,我们 介绍 了 交叉 编译 环境 的 组 成 元 素 ， 以 及 Clang 如 何 与 它们 交互 以 产生 目 
标 平台 的 可 执行 文件 。 我 们 还 讨论 了 Clang 交叉 编译 器 在 其 他 可 能 场景 下 的 应 用 ， 并 提供 了 
关于 如 何 构建 、 安 装 和 使 用 交叉 编译 器 的 说 明 。 

在 下 一 章 中 ， 我 们 将 介绍 Clang 静态 编译 器 ， 并 展示 如 何在 大 型 代码 库 中 搜索 和 查找 常 
见 错误 。 
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人 工 规划 抽象 装置 的 构造 往往 很 困难 ， 因 为 很 难 去 度量 工作 量 的 规模 和 数量 。 与 此 类 
似 ， 软 件 项 目 由 于 异常 庞大 的 复杂 性 ， 有 着 非常 显著 的 失败 历史 。 如 果 说 构建 复杂 软件 需要 
大 量 的 协调 和 组 织 ， 那 么 维护 它 则 是 一 个 更 加 环 手 的 挑战 。 

另外 一 方面 ， 一 个 软件 的 维护 随 着 时 间 的 增长 也 会 变 得 愈 发 困难 ， 这 通常 是 因为 不 同年 
代 的 程序 员 的 代码 风格 和 编程 观念 有 所 不 同 。 当 一 个 新 的 程序 员 负 责 维护 旧 的 软件 时 ， 通 常 
的 做 法 是 简单 地 将 难以 理解 的 旧 代 码 打包 并 隔离 ， 使 它 变 成 一 个 不 可 修改 的 库 。 

如 此 复杂 的 代码 库 需 要 一 个 新 型 工具 来 帮助 程序 员 解 决 某 些 比较 隐 星 的 错误 ( bug)。 
Clang 静态 分 析 器 可 以 自动 分 析 庞 大 的 代码 库 ， 帮 助 程序 员 在 编译 代码 之 前 广泛 检测 各 种 常 
见 的 C、C++ 或 Objective-C 语言 错误 。 本 章 将 介绍 以 下 主题 : 

。 经 典 编 译 器 工具 发 出 的 警告 与 Clang 静态 分 析 器 发 出 的 警告 有 什么 区 别 

e 如 何在 简单 项 目 中 使 用 Clang 静态 分 析 器 

e 如 何 使 用 scan-build 工具 覆盖 大 型 实际 项 目 

e 如 何 用 自 定 义 的 错误 检查 器 扩展 Clang 静态 分 析 器 


9.1 静态 分 析 器 的 作用 

在 LLVM 的 整体 设计 中 ， 如 果 一 个 工具 可 以 处 理 源 代码 (C/C++)， 则 该 工具 属于 Clang 
前 端 ， 这 是 因为 从 LLVM IR 恢复 源 代码 级 别 的 信息 是 非常 困难 的 。 在 Clang 的 工具 中 ， 最 
有 趣 的 工具 之 一 是 Clang 静态 分 析 器 ， 它 通过 一 组 检查 器 来 构建 详细 的 错误 报告 ， 该 报告 类 
似 于 传统 的 小 规模 编译 器 警告 信息 ， 而 每 个 检查 器 负责 检测 违反 某 个 特定 规则 的 现象 。 

与 经 典 警 告 信 息 一 样 ， 静 态 分 析 器 可 帮助 程序 员 在 开发 周期 的 早期 发 现 错误 ， 而 不 需要 
将 错误 检测 推迟 到 运行 时 。 静 态 分 析 是 在 语法 分 析 之 后 ， 但 在 编译 之 前 完成 的 。 另 一 方面 ， 
静态 分 析 器 可 能 需要 大 量 的 时 间 来 处 理 大 型 代码 库 ， 因 此 ， 常 见 的 编译 流程 并 没有 整合 该 
工具 。 例如， 静态 分 析 器 本 身 可 能 花费 数 小 时 来 处 理 整 个 LLVM 源 代 码 ， 并 运行 其 所 有 检 
查 器 。 

Clang 静态 分 析 器 至 少 有 两 个 已 知 的 竞争 对 手 : Fortify 和 Coverity。 惠 普 (HP) 提供 前 
者 ， 而 Synopsis 提供 后 者 。 每 个 工具 都 有 自己 的 优势 和 局 限 性 ， 但 是 只 有 Clang 是 开源 的 ， 
人 允许 用 户 进一步 理解 它 的 工作 原理 ， 并 按照 自身 需求 进行 修改 ， 这 也 是 本 章 的 目标 。 


9.1.1 传统 警告 信息 和 Clang 静态 分 析 器 比较 


Clang 静态 分 析 器 使 用 的 算法 具有 指数 时 间 复 杂 度 ， 即 随 着 正在 分 析 的 程序 单元 增长 ， 
处 理 它 所 需 的 时 间 可 能 会 变 得 非常 长 。 与 许多 实际 使 用 的 指数 时 间 算 法 一 样 ， 它 是 有 界 的 ， 


154 务 9 草 


这 意味 着 可 以 通过 使 用 针对 特定 问题 的 技巧 来 减少 执行 时 间 和 内 存 ， 虽 然 还 不 能 达到 多 项 式 
时 间 复 杂 度 。 

该 工具 的 指数 时 间 性 质 反 映 了 其 最 大 的 局 限 性 : 它 只 能 一 次 分 析 一 个 编译 单元 ， 不 能 执 
行 跨 模块 分 析 或 处 理 整个 程序 。 不 过 它 依 赖 于 一 个 符号 执行 引擎 ， 仍 然 是 一 个 非常 有 用 的 
工具 as 

为 了 举例 说 明 符 号 执行 引擎 如 何 帮 助 程序 员 发 现 复杂 错误 ， 我 们 首先 展示 一 个 非常 简单 
的 错误 ， 大 多 数 编译 器 都 可 以 轻松 检测 到 它 并 发 出 警告 。 请 看 下 面 的 代码 : 


#include <stdio.h> 
void main() { 

int i; 

printf (vgadv;, TY 


} 

在 这 段 代 码 中 ， 我们 使 用 了 一 个 未 初始 化 的 变量 ， 因 此 程序 输出 取决 于 诸如 程序 执行 前 
的 内 存 内 容 等 我 们 无 法 控制 或 预测 的 参数 ， 从 而 会 导致 意外 的 程序 行为 。 因 此 ， 简 单 的 自动 
检查 可 以 在 调试 时 避免 大 量 的 麻烦 。 

如 果 你 熟悉 编译 器 分 析 技 术 ， 可 能 已 经 注意 到 ， 我 们 可 以 通过 前 向 数据 流 分 析 (forward 
dataflow analysis) 来 实现 此 检查 ， 该 分 析 利 用 并 集合 流 运算 符 (union cofluenece operator) 来 
传播 每 个 变量 的 状态 ,不 管 该 变量 是 否 被 初始 化 。 前 向 数据 流 分 析 从 函数 的 第 一 个 基本 块 开 
始 传播 每 个 基本 块 中 变量 的 状态 信息 ， 直 至 后 续 基 本 块 。 合 流 运算 符 决定 如 何 聚 合 来 自 多 个 
前 序 基 本 块 的 信息 。 对 于 一 个 基本 块 ， 并 集合 流 运算 符 会 将 其 所 有 前 序 基本 块 信息 的 并 集 提 
供给 该 基本 块 。 

在 这 个 分 析 中 ， 如 果 一 个 未 初始 化 的 定义 被 使 用 ， 则 应 该 触发 一 个 编译 器 警告 。 为 此 ， 
数据 流 框架 将 为 程序 中 的 每 个 变量 分 配 以 下 状态 : 

e | 符号 (未 知 状态 )， 当 我 们 没有 任何 有 关 该 变量 的 信息 时 。 

e 初始 化 标签 ， 当 我 们 知道 变量 被 初始 化 时 。 

e 未 初始 化 的 标签 ， 当 我 们 确定 变量 没有 被 初始 化 时 。 

e 丁 符号 ， 当 我 们 不 确定 变量 是 否 被 初始 化 时 。 

图 9-1 展示 刚刚 介绍 的 简单 C 程序 的 数据 流 分 析 。 





(1) begin 


{= 

(2) inti; 

fi=uninitialized} 

3) printf(“%d", i); sp 警告 : 使 用 未 
{i=uninitialized} 初始 化 值 "i"。 

(4) end 


1 = 未 知 状态 
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我 们 看 到 ， 这 些 信息 很 容易 跨 代码 行 传播 。 当 它 到 达 使 用 i 的 printf 语句 时 ,框架 
将 检查 这 个 变量 并 发 现 该 变量 是 未 初始 化 的 ， 从 而 得 到 足够 的 证 据 来 发 出 

此 外 ， 由 于 此 数据 流 分 析 属 于 多 项 式 时 间 算 法 复杂 度 ， 因 此 速度 非常 快 。 

为 了 说 明 这 个 简单 的 分 析 存 在 不 精确 的 问题 ， 我 们 假设 程序 员 Joe 经 常 制造 不 可 检测 的 
错误 。Joe 可 以 通过 巧妙 地 使 用 不 同 的 程序 路 径 混淆 变量 的 实际 状态 ， 从 而 非常 简单 地 欺骗 
检测 器 。 我 们 来 看 看 Joe 编写 的 一 个 例子 : 

#include <stdio.h> 

void my function(int unknownvalue) { 

int schroedinger integer; 

if (unknownvalue) 
schroedinger integer = 5; 

Drintf ("Hin)y 

if (!unknownvalue) 


printf ("%d", schroedinger integer); 


} 
现在 让 我 们 来 看 看 我 们 的 数据 流 框架 如 何 计算 这 个 程序 的 变量 状态 ， 如 图 9-2 所 示 。 





{schroedinger_integer = 1, unknown_value = 1} 


int schroedinger_integer; 

{schroedinger_integer = uninitialized, unknown_value = 1} 

) if (unknown_value) 

{schroedinger_integer = uninitialized, unknown_value = 1} 

) schroedinger_integer = 5; 

{schroedinger_integer = initialized, unknown_value = |} 

si 在 这 里 失去 准确 性 ， 它 可 以 
{schroedinger_integer = T, unknown_value = 1} (> 是 未 初始 化 ， 也 可 以 是 未 实 
例 化 ! 





if (lunknown_value) 
ik {schroedinger_integer = T, unknown_value = 1} 


false printf(“%d”, schroedinger | pe mu 无 法 可 靠 地 发 出 警告 
{schroedinger_integer = T, unknown_value = 
8 


) end 


上 = 未 知 状态 
T= 任意 状态 








图 9-2 


我 们 看 到 ， 在 节点 4 中 变量 第 一 次 被 初始 化 (以 粗 体 显示 )。 然 而 ， 有 两 个 不 同 的 
路 径 可 以 到 达 节 点 5: 来 自 节 点 3 的 if 语 句 的 真 分 支 和 假 分 支 。 在 一 个 路 径 中 ， 变 量 
schroedinger integer 是 未 初始 化 的 ， 而 在 另 一 个 路 径 中 是 初始 化 的 。 合 流 操作 符 决 定 
如 何 对 前 面 的 结果 进行 合并 ， 并 集 操 作 符 将 尽量 保留 两 者 的 数据 ， 因 此 声明 schroedinger_ 
integer 为 T (任意 一 个 )。 

当 检测 器 检查 使 用 schroedinger_intege 的 节点 7 时 ， 它 无 法 确定 代码 中 是 否 存 
在 错误 ， 这 是 因为 根据 该 数据 流 分 析 ，schroedinger integer 有 可 能 已 经 初始 化 ,也 
可 能 没有 初始 化 。 换 句 话说 ， 它 确实 处 于 一 个 初始 化 和 未 初始 化 并 存 的 至 加 状态 。 简 单 检测 
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器 可 以 尝试 发 出 有 一 个 值 在 未 被 初始 化 的 情况 下 被 使 用 的 警告 ， 并且 会 正确 地 指向 错误 。 但 
是 ， 如 果 对 Joe 的 代码 的 最 后 一 次 检查 使 用 的 条 件 变 为 ifE (unknownvalue)， 则 发 出 警告 
将 是 误 报 ， 因 为 现在 它 正在 执行 schroedinger_intege 确实 被 初始 化 的 路 径 。 

检测 器 之 所 以 发 生 这 种 精度 损失 问题 ， 是 由 于 数据 流 框架 无 法 感知 不 同 的 路 径 ， 并 且 无 
法 精确 地 描述 在 每 个 可 能 的 执行 路 径 中 所 发 生 的 事情 。 

误 报 是 非常 不 受 欢迎 的 ， 因 为 它们 会 给 程序 员 列 出 一 大 堆 并 不 包含 真正 错误 的 警告 ， 而 
且 也 会 使 真正 的 错误 警告 变 得 难以 辨别 。 实 际 上 ， 即 使 检测 器 只 产生 少量 的 误 报 ， 程 序 员 也 
可 能 会 忽略 所 有 警告 。 
9.1.2 ”符号 执行 引擎 的 高 效 性 

符号 执行 引擎 可 以 解决 简单 的 数据 流 分 析 不 足以 提供 程序 精确 信息 的 问题 。 它 可 以 构建 
一 个 可 达 程 序 状 态 图 ， 并 能 够 推断 程序 运行 时 所 有 可 能 执行 的 代码 路 径 。 回 想 一 下 ， 当 运行 
调试 程序 时 ， 我 们 只 是 在 执行 一 条 路 径 。 即 使 当 我 们 用 一 个 如 valgrind 般 功 能 强大 的 虚拟 机 
来 调试 程序 和 查找 内 存 泄漏 时 ， 它 也 只 会 执行 一 条 路 径 。 

相反 ， 符 号 执行 引擎 可 以 在 不 真正 运行 用 户 代码 的 情况 下 考虑 所 有 可 能 的 执行 路 径 。 这 
是 一 个 非常 强大 的 功能 ,但 处 理 程序 需要 大 量 时 间 。 

与 经 典 数据 流 框架 一 样 ， 该 引擎 会 在 按 程序 执行 顺序 遍历 每 条 语句 时 为 找到 的 每 个 变量 
分 配 初始 状态 。 它 们 的 差别 体现 在 当 到 达 改 变 控 制 流程 的 结构 时 : 该 引擎 将 路 径 分 成 两 条 ， 
然后 分 别 在 每 条 路 径 上 继续 进行 分 析 。 这 个 图 称 为 可 达 程 序 状态 图 ， 图 9-3 用 一 个 简单 的 例 
子 说 明 该 引擎 如 何 推理 Joe 的 代码 。 


第 2 行 : 变量 schroedinger_integer 未 初始 化 。 
变量 unknown_value 的 范围 : 
[-2147483648,2147483647] 


第 3 行 : 执行 真 分 支 l 
unknown_value 值 的 范围 : [-2147483648， Wi 
-1],[1,2147483647] unknown_value 


第 4 行 : 变量 Schroedinger_integer 现在 等 于 5 第 5 行 : 调用 打印 函 


inger i T: i 陋 数 
和 第 6 行 : if (lunknown _value) 
第 5 行 : 调用 打印 函数 值 为 真 
第 6 行 : if(lunknown value) 第 7 行 : printf 使 用 了 未 初始 化 的 变量 
值 为 假 schroedinger integer， 报 告 bug 
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在 这 个 例子 中 ,第 6 行 中 的 第 一 个 if 语句 将 可 达 程 序 状态 图 分 为 两 条 不 同 的 路 径 : 一 
条 路 径 中 ，unknown_value 不 为 零 ， 而 另 一 条 中 unknown_value 为 零 。 从 这 个 部 分 开 
始 ， 引 擎 的 工作 流程 会 考虑 unknown_value 的 约束 条 件 ， 并 用 它 来 决定 下 一 个 分 支 是 否 
会 触发 。 

通过 使 用 这 种 策略 ， 符 号 执行 引擎 得 出 的 结论 是 : 图 9-3 中 的 左边 路 径 将 不 会 使 用 
schroedinger integer 的 值 ， 尽 管 它 已 经 在 这 条 路 径 中 被 定义 为 5。 男 一 方面 ， 该 图 
中 右边 路 径 将 使 用 schroedinger integer 的 值 ， 并 将 其 作为 printf() 函数 的 参数 进 
行 传递 ; 但 是 在 此 路 径 中 ， 该 值 不 会 被 初始 化 。 通 过 使 用 该 图 ， 我们 可 以 精确 地 找到 并 报告 
错误 。 

接 下 来 我 们 比较 可 达 程 序 状态 图 和 相同 代码 的 控制 流 图 (Control Flow Graph, CFG)， 并 
通过 数据 流 方 程 提 供 典 型 代码 分 析 ， 请 看 图 9-4。 


第 2 行 : 声明 变量 schroedinger_integer， 
未 初始 化 


和 第 3 行 : 执行 假 分 支 


第 4 行 : 变量 schroedinger_integer 
现在 等 于 5 


第 5 行 : 调用 打印 函数 
第 6 行 : 执行 真 分 支 第 6 行 : 执行 假 分 支 


第 7 行 : printf 使 用 了 可 能 是 5 或 
者 未 初始 化 的 参数 schroedinger 
integer， 我 们 不 确定 是 否 是 一 个 bug 





图 9-4 
首先 要 注意 的 是 ，CFG 可 以 通过 分 又 来 表示 控制 流 的 变化 ， 但 是 它 也 可 以 合并 节点 
来 避免 在 可 达 程 序 状态 图 中 看 到 的 组 合 爆炸 。 合 并 时 ， 数 据 流 分 析 可 以 使 用 并 集 或 交集 
操作 来 合并 来 自 不 同 路 径 (第 5 行 的 节点 ) 的 信息 。 如 果 使 用 并 集 ， 我 们 可 以 得 出 结论 : 
schroedinger integer 既 未 初始 化 ， 又 等 于 5， 与 上 一 个 例子 相同 。 如 果 使 用 交集 ， 
最 后 没有 关于 schroedinger_integer 的 信息 (未 知 状态 )。 


符号 执行 引擎 正 是 克服 了 经 典 数 据 流 分 析 中 需要 合并 数据 这 一 局 限 性 。 这 样 可 以 得 到 更 
精确 的 结果 ， 与 使 用 不 同 的 输入 测试 程序 所 获得 的 结果 相当 ， 但 代价 是 运行 时 间 和 内 存 消 耗 
量 的 增加 。 


9.2 ”测试 静态 分 析 器 
在 本 节 中 ， 我 们 将 探讨 如 何 实际 使 用 Clang 静态 分 析 器 。 


9.2.1 使 用 驱动 程序 与 使 用 编译 器 

在 测试 静态 分 析 器 之 前 ， 请 记 住 使 用 命令 行 clang 将 触发 编译 器 驱动 程序 ， 而 使 用 命 
令 行 clang -ccl 则 直接 引用 编译 器 。 驱 动 程序 负责 协调 编译 中 涉及 的 其 他 所 有 LLVM 程 
序 的 执行 ， 它 同时 也 负责 提供 有 关系 统 的 必要 参数 。 

尽管 有 些 开发 人 员 由 于 偏好 喜欢 直接 使 用 编译 器 ， 但 这 有 可 能 无 法 找到 只 有 Clang 驱动 
程序 知道 的 系统 头 文件 或 其 他 配置 参数 。 另 一 方面 ， 编 译 器 可 能 为 开发 人 员 提 供 额外 的 选 
项 ， 允 许 其 察看 内 部 的 详细 过 程 以 便 进行 调试 。 让 我 们 来 看 看 如 何 分 别 使 用 它们 来 检查 单个 
源 代码 文件 ， 请 参见 表 9-1。 

表 9-1 编译 器 与 驱动 程序 命令 
编译 器 clang -ccl -analyze —analyzer-checker=<package><file> 


驱动 程序 clang --analyze -Xanalyzer -analyzer-checker=<package><file> 


我 们 使 用 标签 <file> 来 表示 要 分 析 的 源 代码 文件 ， 用 标签 <package> 来 选择 特定 头 
文件 的 集合 。 

使 用 驱动 程序 时 ， 请 注意 --analyze 标志 会 触发 静态 分 析 器 。 为 了 通过 驱动 程序 直接 
向 编译 器 传递 参数 ， 我 们 可 以 使 用 -xanalyzer 标志 ， 把 想 要 传递 的 标志 放 在 其 后 面 传 给 
编译 器 。 由 于 驱动 程序 仅 起 到 中 介 作 用 ， 我 们 的 示例 将 直接 使 用 编译 器 。 而 且 在 我 们 的 简单 
例子 中 ， 直 接 使 用 编译 器 已 经 足够 了 。 如 果 需 要 以 官方 方式 使 用 检查 器 ， 请 使 用 驱动 程序 ， 
并 在 每 个 传递 给 编译 器 的 标志 之 前 增加 -Xxanalyzer 选项 。 


9.2.2 了 解 可 用 的 检查 器 


静态 分 析 器 使 用 检查 器 作为 一 个 基本 单元 对 代码 进行 分 析 ， 每 个 检查 器 负责 查找 特定 
的 错误 类 型 。 静 态 分 析 器 既 允 许 用 户 选 择 适合 自身 需求 的 检查 器 子 集 ， 也 可 以 启用 所 有 检 
查 器 。 

如 果 你 没有 安装 Clang， 请 参阅 第 1 章 以 获取 安装 说 明 。 要 获取 已 安装 的 检查 器 列表 ， 
请 运行 以 下 命令 : 

$ clang -ccl -analyzer-checker-help 


该 命令 会 打印 一 大 串 已 安装 的 检查 器 ， 显 示 Clang 自 带 的 所 有 分 析 功 能 。 我 们 现在 来 检 
查 -analyzer-checker-help 命令 的 输出 : 
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OVERVIEW: Clang Static Analyzer Checkers List 
USAGE: -analyzer-checker <CHECKER or PACKAGE,...> 


CHECKERS: 


alpha.core.BoolAssignment Warn about assigning non-{0,1} values 
to Boolean variables 


检查 器 的 名 称 遵循 标准 格式 <package>.<subpackage>.<checker>， 这 样 便 于 用 
户 只 运行 一 组 特定 的 检查 器 。 
表 9-2 展示 最 重要 的 软件 包 列 表 ， 以 及 每 个 软件 包 所 包含 的 部 分 检查 器 。 
表 9-2 ”软件 包 列表 
包 名 内 容 示例 


alpha.core.BoolRAssignment、 





区 当前 还 在 开发 的 检查 器 ODS DE MA OO 
和 alpha.unix.cstring. 
NotNullTerminated 
core.NullDereference,、 
core 通用 上 下 文 适 用 的 基本 检查 器 core.Dividezero 和 core. 
StackAddressEscape 
cplusplus 用 于 C++ 内 存 分 配 的 单个 检查 器 (其 他 尚 在 开发 中 ) ” cplusplus.NewDelete 


debug.DumpCFG、debug . 


debug 用 于 输出 静态 分 析 器 调试 信息 的 检查 器 DumpDominators 和 debug. 
ViewExplodedGraph 
llvm 用 于 检查 代码 是 否 遵守 LLVM 代码 标准 的 单个 检查 器 ”11lvm.Conventions 
OSX.API、 Osx.cocoa.ClassRelease,、 
Osx 专门 用 于 Mac OS X 程序 的 检查 器 osx.cocoa.NonNilReturnValue 和 


Osx.coreFoundation.CFError 
security.FloatLoopCounter. 
security.insecureAPI. 
security ”代码 安全 漏洞 检查 器 UncheckedReturn、 security. 
insecureAPI .gets 和 security. 
insecureAPI .strcpy 


unix.API、 unix.Malloc、 unix. 
unix 专门 用 于 UNIX 程序 的 检查 器 MallocSizeof 和 unix. 
MismatchedDeallocator 
让 我 们 再 次 运行 能 够 欺骗 大 多 数 编译 器 所 使 用 的 简单 分 析 的 程序 员 Joe 的 代码 。 首 先 ， 
我 们 测试 经 典 的 警告 方法 。 为 了 做 到 这 一 点 ,我 们 只 需 运 行 Clang 驱动 程序 ， 并 让 它 不 继续 
编译 ， 而 只 执行 语法 检查 : 


$ clang -fsyntax-only joe.c 


旨 在 打印 警告 和 检查 语法 错误 的 syntax-only 标志 未 能 检测 到 任何 错误 。 现 在 我 们 
测试 符号 执行 引擎 的 处 理 效果 : 


$ clang -ccl -analyze -analyzer-checker=core joe.c 


如 果 上 述 命令 行 要 求 你 指定 头 文件 位 置 ， 请 按 如 下 所 示 使 用 驱动 程序 : 


$ clang --analyze -Xanalyzer -analyzer-checker=core joe.c 


./joe.c:10:5: warning: Function call argument is an uninitialized value 
printf ("%d", schroedinger integer); 


1 warning generated. 


结果 正 是 我 们 所 预期 的 。 请 记 住 ，analyzer-checker 标志 需要 检查 器 的 完整 
re 软件 包 的 名 称 。 示 例 选 择 使 用 整个 核心 检查 器 包 ， 但 是 我 们 也 可 以 只 使 用 检查 器 
core.CcallRAndMessage 来 检查 函数 调用 的 参数 。 
请 注意 ， 所 有 静态 分 析 器 命令 始终 以 clang -ccl -analyzer 开始 ， 因 此， 如 果 想 
了 解 分 析 器 提供 的 所 有 命令 ， 可 以 使 用 以 下 命令 行 : 


$ clang -ccl -help | grep analyzer 


9.2.3 ”在 Xcode IDE 中 使 用 静态 分 析 器 


如 果 使 用 Apple Xcode IDE， 则 可 以 在 IDE 中 使 用 静态 分 析 器 。 你 需要 先 打开 一 个 项 
目 ， 然 后 在 “Product” 菜 单 中 选择 菜单 项 “ Analyze”。 你 将 看 到 Clang 静态 分 析 融 提供 了 
导致 此 错误 的 确切 代码 路 径 ， 并 且 IDE 将 其 高 亮 显 示 出 来 ， 如 图 9-5 所 示 。 


吕 | 4 P| 国 Test) 央 joe.c) 国 my_function0 
3. Function call argument is an uninitialized value * 





#include <stdio.h> 





分 析 器 能 够 以 plist 格式 导出 信息 ， 然 后 由 Xcode 解释 并 以 用 户 友好 的 方式 显示 。 


9.2.4 生成 HTML 格式 的 图 形 报 告 


静态 分 析 句 也 能 导出 一 个 HTML 文件， 与 Xcode 一 样 ， 它 将 以 图 形 的 方式 指出 代码 中 
导致 异常 行为 的 程序 路 径 。 还 可 以 使 用 -o 参数 以 及 文件 夹 名 称 来 指定 报告 的 存储 位 置 ， 例 
如 使 用 下 面 命令 行 : 


$ clang -ccl -analyze -analyzer-checker=core joe.c -o report 


或 者 ， 也 可 以 按 如 下 方式 使 用 驱动 程序 : 


$ clang --analyze -Xanalyzer -analyzer-checker=core joe.c -o report 
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使 用 这 个 命令 行 时 ,分 析 器 将 处 理 joe.c 并 生成 一 个 类 似 于 Xcode 中 的 报告 ， 并 把 
HTML 文件 存放 于 报告 文件 夹 中 。 命 令 完 成 后 ， 请 检查 文件 夹 并 打开 HTML 文件 查看 错误 
报告 ， 你 应 该 看 到 与 图 9-6 类 似 的 报告 


#include <stdio.h> 
void my function(int unknownvalue) { 
全 ,schroedinger_integer deciared without an initial value 一 


if (me) 
全 一 Assuming 


schroedinger integer = 5; 
printf("hi"); 
if (lunknownvalue) 


print£ ("sd" ， Blo) ， 


~ Function call argument ls an uninitialized value 





9.2.5 ”处 理 大 型 项 目 
在 使 用 静态 分 析 器 检查 大 型 项 目 时 ， 你 可 能 不 愿意 编写 Makefile 或 bash 脚本 来 为 每 
个 项 目 源 文件 调用 相应 的 分 析 器 。 为 此 ， 静 态 分 析 器 自 带 一 个 便利 的 工具 scan-build。 
scan-build 的 工作 原理 是 替换 用 于 定义 C/C++ 编译 器 命令 的 cc 或 CXXx 环境 变量 ， 
从 而 干涉 正常 的 项 目 构 建 过 程 。 它 会 在 编译 之 前 分 析 每 个 源 代码 文件 ， 然 后 完成 正常 编译 工 
作 。 最 后 ， 它 生成 可 以 在 浏览 器 中 查看 的 HTML 报告 。 基 本 的 命令 行 结构 非常 简单 : 


$ scan-build <your build command> 


你 可 以 在 scan-build 之 后 自由 运行 任何 构建 命令 ， 比 如 make。 例 如 ， 要 构建 Joe 
的 程序 ， 我 们 不 需要 用 Makefile， 而 是 直接 提供 以 下 编译 命令 : 


$ scan-build gcc -c joe.c -o joe.o 
命令 完成 后 ， 可 以 运行 scan-view 来 检查 错误 报告 : 
$ scan-view <output directory given by scan-build> 


scan-build 打印 的 最 后 一 行 给 出 了 运行 scan-view 所 需 的 参数 。 该 参数 对 应 
Pewee oe ey 你 应 该 看 到 一 个 具有 良好 格式 的 网 站 ， er 





File Line Path Length | 
Uninitialized argument value joe.c 10 5 View Fanart Raport Bug Open Fle 








图 9-7 


一 个 真实 的 例子 : 在 Apache 中 查找 错误 

在 本 小 节 中 ， 我们 将 通过 一 个 真实 的 例子 证 明 在 大 型 软件 项 目 中 查找 错误 是 很 容易 
的 。 本 小 节 的 例子 需要 通过 http://httpd.apache.org/download.cgi 获取 最 新 的 
Apache HTTP Server 的 源 代码 压缩 包 。 编 写本 书 的 时 候 对 应 的 版 本 是 2.4.9。 在 我 们 的 例子 
中 ， 我 们 将 通过 控制 台 下 载 并 解压 当前 文件 夹 中 的 文件 : 


$ wget http://archive.apache.org/dist/httpd/httpd-2.4.9.tar.bz2 
$ tar -xjvf httpd-2.4.9.tar.bz2 


我 们 依赖 scan-build 来 检查 该 源码 库 。 为 此 ， 我们 首先 需要 重 现 生成 构建 脚本 的 步 
又 。 请 注意 ， 该 步骤 需要 所 有 编译 Apache 项 目的 依赖 项 。 在 检查 确实 拥有 所 有 依赖 项 之 
后 ， 请 使 用 以 下 命令 序列 : 


$ mkdir obj 
$ cd obj 
$ scan-build ../httpd-2.4.9/configure -prefix=$ (pwd)/../install 


我 们 使 用 prefix 参数 来 为 这 个 项 目 指定 一 个 新 的 安装 路 径 ， 并 避免 需要 在 主机 上 
拥有 管理 权限 这 一 问题 。 但 如 果 你 不 打算 实际 安装 Apache， 那 么 ， 只 要 不 运行 make 
instal1， 就 不 需要 提供 任何 额外 的 参数 。 在 我 们 的 例子 中 ， 我 们 将 安装 路 径 定义 为 一 
名 为 install 的 文件 夹 ， 它 将 在 我 们 下 载 源 代码 压缩 包 的 相同 目录 中 创建 。 请 注意 ， 我 们 
还 使 用 scan-build 作为 该 命令 的 前 缀 ， 这 将 覆盖 CC 和 CXX 环境 变量 。 

在 配置 脚本 创建 所 有 Makefiles 之 后 ， 即 可 启动 实际 的 构建 过 程 。 但 不 是 只 运行 make， 
而 是 使 用 scan-build 拦截 它 : 


$ scan-build make 


由 于 Apache 代码 非常 大 ， 分 析 过 程 需要 花费 数 几 分 钟 ， 最 后 发 现 了 82 个 错误 。 图 9-8 
是 scan-view 的 示例 报告 。 
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Called function pointer ls null (null dereference) 
Dereference of null pointer 

Dereference of undefined polnter value 
Division by zero 

Result of operation is garbage or undefined 














图 9-8 


在 臭名 昭著 的 heartbleed 漏洞 影响 了 所 有 的 OpenSSL 实现 之 后 ， 尽 管 该 漏洞 引起 了 空 
前 的 关注 ， 静 态 分 析 咒 仍然 可 以 在 Apache SSL 实现 文件 modules/ssl/ssl util.c 和 
modules/SSL/ssl engine config.c 中 找到 6 个 潜在 漏洞 (possible bug)。 请 注意 ， 这 
些 漏洞 可 能 存在 于 从 未 实际 执行 过 的 路 径 ， 可 能 并 不 是 真正 的 漏洞 ， 因 为 静态 分 析 器 为 了 在 
用 户 可 接受 的 时 间 内 完成 分 析 ， 所 以 只 能 在 有 限 的 范围 内 工作 。 因 此 我 们 无 法 断定 它们 是 否 
是 真正 的 漏洞 。 我 们 在 这 里 给 出 一 个 所 赋值 是 无 用 值 或 未 定义 值 的 例子 ， 如 图 9-9 所 示 。 


I96 | const char *ssl cmd SSLVerifyCliaent(cmd parms *cmd, 
997 void wdcfg， 
const char *arg) 


SSLDirConfigRec *dc = (SSLDirConfigRec *)dcfg; 


SSLSrvConfigRec *sc = mySrvConfig(cmd->server); 
ol verify t mode, 


const char *erry 


if (BE ~ i)) 《 


return err} 


} 


if (cmd->path) { 


dc->nVerifyClient » BM; 
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这 个 例子 展示 了 以 一 条 执行 路 径 ， 其 末尾 是 向 dc->nVerifyclient 赋值 ， 而 所 赋 的 
值 是 未 定义 的 。 这 一 路 径 彻 查 了 ssl _cmd verify parse() 函数 调用 ， 展 示 了 分 析 器 在 
同一 编译 模块 中 检查 复杂 跨 函 数 路 径 的 能 力 。 在 这 个 示例 函数 中 ， 静 态 分 析 器 显示 在 执行 路 
径 上 一 个 mode 变量 没有 被 赋值 ， 因 此 仍然 是 未 初始 状态 。 


上 述 问 题 可 能 并 不 是 一 个 真正 的 漏洞 。 原 因 在 于 ssl_cmd verify_parse() 
函数 可 能 已 经 考虑 了 输入 参数 cmd_ parms 所 有 实际 的 取 值 范围 (注意 上 下 文 依 
赖 )， 并 在 这 些 取 值 范围 内 正确 地 完成 初始 化 工作 。scan-build 工具 发 现 了 这 
个 孤立 模块 存在 可 能 会 导致 问题 的 路 径 ， 但 没有 证 据 表 明 该 模块 的 用 户 使 用 了 会 
导致 问题 的 输入 。 静 态 分 析 器 无 法 在 整个 项 目的 范围 内 分 析 该 模块 ， 因 为 这 样 的 
运行 时 间 将 会 变 得 过 于 漫长 (该 算法 的 复杂 度 呈 指数 型 增长 ) 。 


上 述 问题 路 径 包 含 了 11 个 运行 步骤， 但 我 们 在 Apache 项 目 中 找到 的 最 长 问题 路 径 有 
42 个 运行 步 又。 该 路 径 产 生 于 modules/generators/mod cgid.c 模块 中 ， 并 违反 一 
个 标准 的 CAPI 调用 : 它 用 一 个 空 指针 参数 调用 stzlen( ) 函数 。 

如 果 想 要 了 解 所 有 这 些 报告 细节 ， 请 立即 动手 ， 亲 自 运行 这 些 命令 。 


9.3 ”使 用 自 定义 的 检查 器 扩展 静态 分 析 器 


由 于 静态 分 析 器 的 良好 设计 ， 我们 可 以 轻松 地 用 自 定义 检查 器 对 其 进行 扩展 。 请 记 住 ， 
静态 分 析 器 的 功能 是 由 其 包含 的 检查 器 决定 的 ， 如 果 想 要 分 析 是 否 有 任何 代码 以 非 预 期 的 方 
式 调用 了 某 个 API， 则 需要 了 解 如 何 将 此 特定 领域 的 知识 戏 和 人 Clang 静态 分 析 器 中 。 


9.3.1 熟悉 项 目 架 构 


Clang 静态 分 析 器 的 源 代 码 位 于 LLvm/tools/clang， 头 文件 位 于 include/clang/ 
StaticRanalyzer， 源 代码 位 于 Lib/Staticanalyzer。 文 件 夹 被 分 为 三 个 不 同 的 子 文件 
夹 : Checkers、Core 和 Frontend。 

Core 负责 在 源码 级 别 模拟 程序 执行 过 程 ， 并 通过 使 用 观察 者 模式 ( visitor pattern) 在 每 
个 程序 点 (对 应 重要 语句 之 前 或 之 后 ) 调用 已 注册 的 检查 器 ， 以 检查 给 定 的 不 变量 是 否 被 满 
足 。 例 如 ， 如 果 某 个 检查 器 负责 检测 同一 个 内 存 区 域 是 否 存在 被 双重 释放 的 异常 行为 ， 它 将 
监测 malloc() 和 free() 调用 ， 并 在 检测 到 双重 释放 内 存 时 生成 一 个 错误 报告 。 

符号 执行 引擎 无 法 像 运行 程序 时 那样 使 用 精确 的 变量 值 来 模拟 程序 。 例 如 ， 如 果 程 序 要 
求 用 户 输入 一 个 整数 值 ， 在 某 个 实际 的 运行 中 程序 会 得 到 确定 的 值 5。 符 号 执行 引擎 的 强大 
之 处 在 于 能 对 一 个 程序 所 有 可 能 的 运行 状态 进行 推理 ; 它 使 用 符号 ( svals) 而 不 是 具体 的 
值 来 完成 这 一 目标 。 一 个 符号 可 能 对 应 任何 整数 、 浮 点 数 甚至 完全 未 知 的 值 。 关 于 该 值 的 信 
息 越 多 ， 它 就 越 精准 。 

理解 符号 引擎 项 目的 关键 之 处 在 于 ProgramState、ProgramPoint 和 Exploded 
Graph 这 三 个 重要 的 数据 结构 。 第 一 个 数据 结构 表示 当前 状态 下 的 执行 环境 。 例 如 ， 在 分 
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析 Joe 的 代码 时 ， 它 会 标注 相应 变量 的 值 为 5。 第 二 个 代表 程序 流 中 在 语句 之 前 或 之 后 的 特 
定 节点 ， 例如， 将 5 赋值 给 一 个 整数 变量 之 后 的 节点 。 最 后 一 个 数据 结构 表示 可 达 程 序 状态 
的 完整 图 结构 。 该 图 结构 的 节点 由 ProgramState 和 ProgramPoint 二 元 组 表示 ， 这 意 
味 着 每 个 程序 节点 都 有 一 个 与 之 相关 的 特定 状态 。 例 如 ,将 5 赋 给 一 个 整数 变量 之 后 的 程序 
节点 具有 该 变量 与 常量 5 相连 的 状态 。 

正如 在 本 章 开 头 已 经 指出 的 那样 ，EBxplodedGraph ( 即 可 达 程 序 状态 图 ) 代表 对 经 
典 程序 控制 流 图 (CFG) 的 重要 扩展 。 注 意 ， 一 个 具有 两 个 连续 但 非 嵌 套 的 if 语句 的 小 
型 CFG 将 在 可 达 程 序 状态 图 中 展开 为 四 个 不 同 的 路 径 ， 即 组 合 爆炸 。 为 了 节省 空间 ， 该 
图 被 折 又 ， 这 意味 着 如 果 新 创建 的 图 节点 与 现 有 某 个 图 节点 具有 相同 的 程序 节点 和 状 
态 ， 则 它 会 重用 该 图 节点 而 不 是 分 配 一 个 新 的 节点 ， 这 可 能 导致 循环 。 为 了 实现 该 行为 ， 
ExplodedNode 继承 LLVM 库 的 超 类 11vm: :FoldingSetNode。 因 为 在 编译 器 的 中 间 
阶段 和 后 端 广泛 使 用 折 友 来 表示 程序 ，LLVM 库 为 此 专门 实现 了 一 个 通用 类 。 

静态 分 析 器 的 总 体 设计 可 以 分 为 以 下 几 部 分 : 引擎 ， 负 责 模拟 程序 执行 路 径 并 管理 其 他 
组 件 ; 状态 管理 器 ， 负 责 维护 ProgramState 对 象 ; 约束 管理 器 ， 负 责 推 导 指 定 程序 路 径 
对 ProgramState 产生 的 约束 ; 存储 管理 器 ， 负 责 管 理 程序 存储 模型 。 

Clang 分 析 器 的 另 一 个 重要 功能 是 对 每 条 程序 执行 路 径 上 的 内 存 行为 进行 建 模 。 这 对 于 
像 C 和 C++ 这样 的 语言 来 说 是 相当 具有 挑战 性 的 ， 因 为 它们 为 开发 人 员 提 供 了 许多 种 访问 
同一 块 内 存 的 方法 ， 即 同一 块 内 存 可 能 存在 别名 。 

Clang 分 析 器 实现 了 Xu 等 人 在 论文 中 描述 的 区 域内 存 模型 ( 见 本 章 最 后 的 参考 文献 )， 
该 内 存 模型 甚至 能 够 区 分 数组 中 每 个 元 素 的 状态 。Xu 等 人 提出 了 一 个 层次 化 的 内 存 区 域 结 
构 ， 例 如 ， 在 该 结构 下 ， 一 个 数组 元 素 被 认为 是 数组 的 一 个 子 区 域 ， 而 数组 又 是 堆栈 的 一 个 
子 区 域 。C 语言 中 的 每 个 lvalue ( 换 而 言 之 ， 每 个 变量 或 被 解 引用 的 引用 ) 都 有 一 个 代表 
其 工作 内 存 的 相应 区 域 。 另 一 方面 ， 每 个 内 存 区 域 的 内 容 都 使 用 绑 定 信息 来 建 模 。 每 个 绑 定 
信息 都 将 一 个 符号 值 与 一 个 内 存 区 域 关 联 起 来 。 这 里 所 讲述 的 信息 可 能 太 多 ， 难 以 被 读者 吸 
收 ， 所 以 我 们 下 面 准备 通过 编写 代码 实例 帮助 读者 消化 它们 。 


9.3.2 自 定 义 检查 器 


假设 我 们 正在 研究 控制 核反应 堆 的 某 个 嵌入 式 软件 ， 它 依赖 于 由 两 个 基本 调用 函数 组 成 
的 API : turnReactoron() 和 SCRAM() (关闭 反应 堆 )。 一 个 核反应 堆 由 燃料 和 控制 棒 
组 成 ， 前 者 负责 发 生 核反应 ， 后 者 包含 中 子 吸收 剂 ， 负 责 减缓 反应 ， 并 使 反应 堆 处 于 可 控 的 
核电 厂 状 态 ， 而 非 不 可 控 的 核弹 状态 。 

我 们 的 客户 提供 如 下 信息 : 连续 两 次 调用 ScRAM( ) 可 能 会 堵塞 控制 棒 ， 而 连续 两 次 调 
用 turnReactoron( ) 可 能 会 导致 反应 失控 。 这 是 一 个 有 严格 使 用 规则 的 API 接口 ， 我 们 
的 任务 是 在 大 规模 代码 库 投入 生产 之 前 对 其 进行 审查 ， 确 保 它 永远 不 违反 以 下 规则 : 

e 没有 任何 代码 路 径 可 以 在 不 干预 turnReactoron( ) 的 情况 下 多 次 调用 SCRAM( ) 

e 没有 任何 代码 路 径 可 以 在 不 干预 ScCRAM( ) 的 情况 下 多 次 调用 turnReactoron() 
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作为 例子 ， 请 考虑 下 面 的 代码 : 


int SCRRM() ; 
int turnReactoron () ; 


void test loop(int wrongTemperature, int restart) { 
turnReactoron () ; 
if (wrongTemperature) { 
SCRAM () ; 
} 
if (restart) { 
SCRAM () ; 


} 


turnReactoron () ; 
// code to keep the reactor working 
SCRAM () ; 


} 


如 果 变 量 wrongTemperature 和 restart 都 不 为 零 ， 则 此 代码 违反 了 上 述 规则 ， 
因为 这 会 导致 在 不 干预 turnReactoron() 的 情况 下 两 次 调用 ScCRAM( ) 。 如 果 两 个 参 
数 都 为 零 ， 那 么 它 也 会 违反 API 规则 ， 因 为 代码 会 在 不 干预 ScRAM( ) 的 情况 下 两 次 调用 
turnReactorOn( ) 。 

用 自 定义 检查 器 解决 该 问题 

你 可 以 尝试 肉眼 检查 代码 ， 但 这 样 非常 单调 且 容 易 出 错 ， 也 可 以 使 用 像 Clang 静态 分 析 
器 这 样 的 工具 ， 但 问题 是 现 有 Clang 静态 分 析 器 无 法 理解 核电 厂 的 相关 API。 因 此 ， 我们 将 
通过 实现 一 个 自 定义 的 检查 器 来 解决 这 个 问题 。 

解决 问题 的 第 一 步 是 对 不 同 程序 状态 间 所 传递 的 信息 进行 相应 的 抽象 和 建 模 。 在 这 个 问 
题 上 ， 我 们 关心 的 是 反应 扒 处 于 开 还 是 关 状 态 。 另 外 ， 我 们 可 能 不 知道 反应 堆 的 状态 ， 因 此 
我 们 的 状态 模型 包含 三 种 可 能 的 状态 : 未 知 、 开 、 关 。 

现在 ， 我 们 已 经 有 了 一 个 检查 器 如 何 处 理 这些 状 态 的 初步 思路 。 

编写 状态 类 

让 我 们 将 它 付 诸 实践 。 我 们 将 基于 SimpleStreamCchecker .cpp 来 实现 我 们 的 代码 ， 
它 是 一 个 Clang 自 带 的 样本 检查 器 。 

在 Jib/StaticRAnalyzer/Checkers 中 ， 应 该 创建 新 文件 ReactorChecker . 
CPP， 并 首先 编写 一 个 类 来 表示 需要 追踪 的 状态 : 


#include "ClangSRCheckers .hy 

#include "clang/staticAnalyzer/Core/BugReporter/BugType.h" 

#include "clang/StaticAnalyzer/Core/Checker.h" 

#include "clang/StaticAnalyzer/Core/PathSensitive/CallEvent.h" 
#include "clang/StaticAnalyzer/Core/PathSensitive/CheckerContext.h" 
using namespace clang; 

using namespace ento; 

class ReactorState { 

private: 
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enum Kind {on, Off} K; 


public: 
ReactorState (unsigned InK) : K((Kind) InK) {} 
bool ison() const { return K == On; } 


bool isOff() const { return K == Off; } 

static unsigned geton() { return (unsigned) On; } 

static unsigned getOff() { return (unsigned) Off; } 

bool operator== (const ReactorState &X) const { 
return K == X.K; 


} 
void Profile(llvm::FoldingSetNodeID &ID) const { 
ID.AddIinteger (K); 


} 
本 


该 类 的 数据 部 分 仅 限于 Kind 类 的 单个 实例 。 请 注意 ，Programstate 类 将 管理 我 们 
正在 编写 的 状态 信息 。 

ProgramState 的 不 可 修改 性 

关于 ProgramState， 需 要 指出 的 一 点 是 其 不 可 修改 的 特性 。 它 一 旦 构建 完成 ， 则 不 
能 再 被 修改 ， 因 为 它 代表 给 定 执 行路 径 中 特定 程序 点 的 计算 状态 。 因 此 ， 在 可 达 程 序 状态 图 
中 ， 每 个 节点 都 代表 一 对 不 同 的 程序 点 和 状态 的 组 合 ， 这 种 情况 与 处 理 CFG 的 数据 流 分 析 
不 同 。 这 种 情况 下 ， 如 果 程 序 存在 循环 ， 则 循环 的 每 次 迭代 都 将 产生 一 个 全 新 的 路 径 ， 以 记 
录 这 次 新 迭代 的 相关 信息 。 数 据 流 分 析 则 与 此 相反 ， 循 环 结构 会 导致 用 新 信息 更 新 循环 体 状 
态 ， 直 到 达到 固定 点 。 

然而 正如 前 面 强调 的 那样 ， 一 旦 符号 执行 引擎 遇 到 的 节点 表示 给 定 循环 体 中 具有 相同 状 
态 的 同一 程序 点 ， 则 认为 在 该 路 径 中 没有 新 的 信息 要 处 理 ， 并 且 重 用 该 节点 而 不 是 创建 一 个 
新 的 节点 。 男 一 方面 ， 如 果 符 号 执行 引擎 发 现 该 循环 体 不 断 地 产生 新 的 状态 更 新 ， 它 很 快 就 
会 达到 自身 的 一 个 局 限 : 它 会 在 完成 预定 义 的 迭代 次 数 后 放弃 该 路 径 ， 而 该 次 数 是 启动 该 工 
具 时 的 一 个 可 配置 参数 。 

代码 剖析 

由 于 状态 一 旦 创建 就 不 可 变 ， 因 此 ReactorState 类 只 需要 构造 函数 ， 而 不 需要 设置 函数 ， 
也 不 需要 可 以 改变 其 状态 的 类 成 员 函 数 。 为 此 我 们 编写 了 ReactorState(unsigned InK) 
构造 函数 ， 其 输入 参数 为 当前 反应 堆 状 态 对 应 的 整数 编码 。 

最 后 ， 由 于 ExplodedNode 是 FoldingSetNode 的 子 类 ， 它 必须 实现 Profile 函 
数 。FoldingSetNode 类 要 求 其 所 有 子 类 必须 提供 这 些 方法 来 帮助 LLVM 的 折 竺 优化 跟踪 
节点 的 状态 ， 并 确定 两 个 节点 是 否 相等 (相等 的 节点 可 以 被 折 释 )。 因 此 ，Profile 函数 解 
释 数字 K 代表 当前 节点 状态 。 

你 可 以 使 用 任何 以 Add 开头 的 FoldingSetNodeiID 成 员 函 数 来 告知 执行 引擎 用 以 
辨别 对 象 实例 的 独特 编码 (请 参阅 1lvm/ADT/FoldingSet.h)。 我 们 的 例子 中 使 用 了 
RAddInteger() 成 员 函 数 。 


168 锡 9 募 


定义 Checker 子 类 
接 下 来 我 们 完成 checker 子 类 的 定义 : 


class ReactorChecker : public Checker<check::PostCall> { 
mutable IdentifierIinfo *IIturnReactorOn, *IISCRAM; 
OwningPtr<BugType> DoubleSCRAMBugType; 
OwningPtr<BugType> DoubleONBugType; 
void initIdentifierInto (RSTContext &Ctx) const; 
void reportDoubleSsCRAM(const CallEvent g&Call, 
CheckerContext &C) const; 
void reportDoubleON(const CallEvent &Call, 
CheckerContext &C) const; 
publie: 
ReactorChecker () ; 
/// Process turnReactoron and SCRRM 
void checkPostCall (const CallEvent &Call, CheckerContext &C) const; 


}; 


Kg Clang 版 本 注意 事项 : Clang 3.5 版 本 开始 弃 用 OwningPtr<> 模板 类 ， 取 而 代 
之 的 是 标准 的 C++ std: :unique ptr<> 模板 类 ， 二 者 都 提供 智能 指针 实现 。 


上 述 代 码 的 第 一 行 指定 我 们 正在 使 用 带 有 一 个 模板 参数 的 Checket 的 子 类 。 该 类 也 可 
以 接收 多 个 模板 参数 ， 这 些 参数 代表 我 们 要 实现 的 检查 器 需要 访问 的 所 有 程序 点 。 从 技术 上 
讲 ， 这 些 模板 参数 用 于 派生 一 个 自 定义 的 checker 类 ， 该 类 为 所 有 模板 参数 类 的 子 类 。 因 
此 在 上 述 代码 中 ， 检 查 器 将 继承 基 类 Postcall。 这 个 继承 关系 被 用 来 实现 只 在 访问 我 们 
感 兴趣 的 对 象 时 调用 的 访问 者 模式 。 为 此 ， 我 们 的 类 必须 实现 成 员 函 数 checkPostCcall。 

读者 可 能 对 如 何 注 册 检 查 器 以 访问 各 种 类 型 的 程序 点 感 兴 趣 (查阅 Checker 
Documentation.cpp)。 在 本 例 中 ,我 们 感 兴趣 的 是 访问 紧 随 在 函数 调用 之 后 的 程序 点 ， 
因为 我 们 需要 记录 每 个 核电 站 API 函数 被 调用 之 后 的 状态 变化 。 

由 于 检查 器 的 无 状态 设计 ， 示 例 代码 中 的 成 员 函 数 使 用 关键 字 const。 但 是 ,我 们 希 
望 缓存 代表 turnReactoron( ) 和 SCRAM( ) 两 个 符号 的 IdentifierInfo 对 象 的 检索 结 
果 。 为 此 ， 我们 使 用 mutable 关键 字 以 绕 过 const 限制 。 


< 请 谨慎 使 用 mutable 关键 字 。 我 们 并 没有 违反 检查 器 的 设计 原则 ， 因 为 我 们 只 
是 为 了 多 次 调用 检查 器 时 能 更 快 地 完成 计算 而 对 结果 进行 缓存 ， 而 该 检查 器 从 概 
念 上 而 言 仍然 是 无 状态 的 。mutab1le 关键 字 只 能 用 于 互 斥 锁 或 这 种 缓存 场景 。 


我 们 还 要 通知 Clang 基础 设施 我 们 正在 检测 一 种 新 的 错误 。 为 此 ， 必 须 增加 新 的 
BugType 实例 ， 每 个 新 实例 对 应 一 个 要 报告 的 新 错误 类 型 : 连续 两 次 调用 SCRAM( ) 对 应 的 
错误 和 连续 两 次 调用 turnReactoron( ) 对 应 的 错误 。 我 们 还 使 用 LLVM 的 owningPtr 
类 来 包装 对 象 ， 该 类 实现 了 智能 指针 的 功能 ， 用 来 在 Reactorchecker 对 象 被 销毁 后 自动 
回收 对 象 。 

我 们 把 自 定 义 的 两 个 类 ReactorState 和 ReactorChecker 放置 于 一 个 匿名 命名 空 
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间 中 ， 因 为 我 们 确定 这 两 个 类 只 会 在 局 部 范围 内 使 用 ， 这 样 可 以 避免 链接 器 将 它们 导出 至 
外 部 。 

编写 注册 宏 

深入 介绍 类 实现 之 前 ， 必 须 使 用 自 定义 的 状态 来 扩展 分 析 器 引擎 使 用 的 Program 
State 实例 ， 该 过 程 可 以 通过 调用 一 个 宏 来 完成 : 

REGISTER MAP WITH PROGRRMSTRATE (RS，int，ReactorState) 

注意 ， 上 述 宏 在 末尾 不 使 用 分 号 ， 它 将 为 每 个 Programstate 实例 关联 一 个 新 的 映射 
表 。 第 一 个 参数 可 以 是 任何 名 称 ， 方便 之 后 对 该 数据 进行 引用 ; 第 二 个 参数 是 映射 键 的 类 
型 ， 第 三 个 参数 是 我 们 要 存储 的 对 象 的 类 型 (在 此 例 中 是 Reactorstate 类 )。 

检查 器 通常 使 用 映射 表 来 存储 其 状态 ， 因 为 它 经 常 需要 将 一 个 新 的 状态 与 一 个 特定 的 
资源 关联 起 来 ， 例 如 在 本 章 开始 的 例子 中 ,检测 器 需要 知晓 每 个 变量 的 状态 (初始 化 或 未 初 
始 化 )。 在 这 种 情况 下 ， 映 射 键 值 为 变量 名 称 ， 存 储 的 值 为 对 应 于 初始 化 或 未 初始 化 状态 的 
自 定义 类 。 有 关 将 信息 注册 到 程序 状态 的 更 多 方法 ,请 查看 Checkercontext.h 中 的 宏 
定义 。 

值得 注意 的 是 ,我 们 的 场景 下 并 不 需要 一 个 真正 的 映射 表 ， 因 为 每 个 程序 点 总 是 只 存储 
一 个 状态 。 因 此 ， 我 们 将 始终 使 用 键 值 1 访问 该 映射 表 。 


实现 Checker 子 类 
我 们 的 示例 检查 絮 的 类 构造 函数 实现 如 下 : 
ReactorChecker: :ReactorChecker() : IIturnReactorOon(0), IISCRAM(O0) { 


// Initialize the bug types. 
DoubleSCRAMBugType .reset ( 
new BugType ("Double SCRAM", 
"Nuclear Reactor API Error")); 
DoubleONBugType.reset (new BugType ("Double ON", 
"Nuclear Reactor API Error")); 


} 


KY Clang 版 本 注意 事项 : 从 Clang 3.5 开始 ，BugType 构造 函数 调用 需要 更 改 为 

BugType(this, "Double SCRAM", "Nuclear Reactor API Error") 
和 BugType(this, "Double ON", "Nuclear Reactor API Error"), 
即 添加 this 关键 字 作 为 第 一 个 参数 。 


我 们 的 构造 函数 使 用 owningPtr 类 的 reset() 成 员 函 数 来 实例 化 新 的 BugType 对 
象 ， 并 提供 新 错误 类 型 的 描述 。 构 造 函 数 也 会 初始 化 IdentifierInfo 指针 。 接 下 来 ,我 
们 定义 帮助 函数 缓存 这 些 指 针 的 结果 : 


void ReactorChecker: :initIdentifierInfo(ASTContext &Ctx) const { 
if (IIturnReactoroOn) 
return; 
IIturnReactorOon = &Ctx.Idents.get ("turnReactorOn"),; 
IISCRAM = &Ctx.Idents.get ("SCRAM"); 


} 
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ASTContext 对 象 包含 特定 的 AST 节 点 ， 这 些 节点 包含 用 户 程 序 中 使 用 的 类 型 和 声 
明 。 可 以 使 用 ASTContext 对 象 来 查找 我 们 想 要 监视 的 函数 的 确切 标识 符 。 接 下 来 我 们 实 
现 访 问 者 模式 函数 checkPostCcal1。 请 记 住 ， 它 是 一 个 const 函数 ， 不 能 修改 检查 器 的 
状态 : 


void ReactorChecker: :checkPostCall (const CallEvent &Cal1l， 
CheckerContext &C) const { 

initIdentifierIinfo(C.getASTContext () ) ; 

if (!Call.isGlobalCFunction()) 
return; 

if (Call.getCalleeIdentifier() == IIturnReactoron) { 
ProgramStateRef State = C.getState(); 
const ReactorState *S = State->get<RS>(1); 


if (S && S->ison()) { 
reportDoubleON (Call, C); 
return; 


} 
State = State->set<RS>(1, ReactorState::geton()); 
C.addTransition(State); 
return; 

} 

if (Call.getCalleeIdentifier() == IISCRAM) { 
ProgramStateRef State = C.getSstate(); 
const ReactorState *S = State->get<RS> (1) ; 


if (S && S->isoff()) { 
reportDoubleSCRAM (Cal1，C) ; 
return; 


} 

State = State->set<RS>(1, ReactorState::getoff()),; 
C.addTransition (State); 

return; 


} 


上 述 函 数 的 第 一 个 参数 类 型 为 callEvent， 由 于 我 们 注册 的 访问 者 模式 是 函数 调用 
之 后 执行 的 类 型 ， 因 此 该 参数 保留 的 是 刚好 在 当前 程序 点 前 程序 所 调用 的 确切 函数 (请 
参阅 callEvent.h)。 第 二 个 参数 为 checkercontext 类 型 ， 它 提供 当前 程序 点 的 
当前 状态 的 相关 信息 ， 因 为 我 们 的 检查 器 被 设计 为 无 状态 的 ， 所 以 该 参数 也 是 程序 状态 
的 唯一 信息 源 。 我 们 使 用 该 参数 来 检索 ASTContext 并 初始 化 IdentifierInfo 对 
象 ， 这 些 对 象 是 检查 正在 监视 的 函数 所 必需 的 。 我 们 查询 callEvent 对 象 来 检查 它 是 
否 是 turnReactoron() 函数 的 调用 。 如 果 是 ， 则 需要 将 核反应 堆 的 状态 转换 到 开启 
状态 。 

在 这 之 前 ,我 们 首先 检查 核反应 堆 的 状态 是 否 为 已 经 开启 ， 若 是 将 导致 错误 。 请 注意 ， 
在 State->get<RS>(1) 语句 中 ，RS 是 我 们 为 所 注册 的 程序 状态 的 新 特征 所 取 的 名 称 ，1 
是 访问 映射 表 地 址 的 固定 整数 。 如 之 前 所 解释 的 ， 这 种 情况 下 并 不 需要 映射 表 ， 但 是 映射 表 
可 以 使 开发 人 员 很 容易 扩展 检查 器 以 监视 更 复杂 的 状态 。 
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我 们 将 存储 的 状态 恢复 为 一 个 const 指针 ， 因 为 该 数据 对 应 当前 正在 处 理 的 程序 点 信 
息 ， 而 这 是 不 可 变 的 。 我 们 首先 需要 检查 它 是 否 为 空 引 用 ， 如 果 为 空 则 代表 我 们 不 知道 反应 堆 
是 开启 还 是 关闭 状态 。 如 果 是 非 空 ， 则 检查 它 是 否 为 开启 状态 ， 如 果 是 则 结束 分 析 并 报告 此 
错误 。 如 果 是 关闭 状态 ， 则 使 用 ProgramStateRef set 成 员 函 数 创建 一 个 新 状态 ， 并 将 此 
新 状态 提供 给 addTransition() 成 员 函 数 ， 该 成 员 函 数 将 记录 信息 并 在 ExplodedGraph 
图 结构 中 创建 一 条 新 的 边 。 只 有 实际 状态 的 改变 才 会 导致 创建 新 边 。 我 们 采用 类 似 的 逻辑 来 
处 理 SCRAM 的 情况 。 

如 下 代码 实现 错误 报告 成 员 函 数 : 


void ReactorChecker: :reportDoubleON(const CallEvent &Call, 
CheckerContext &C) const { 
ExplodedNode *ErrNode = C.generateSink () ; 
if (!ErrNode) 
return; 
BugReport *R = new BugReport (*DoubleONBugType, 
"Turned on the reactor two times", ErrNode); 
R->addRange (Call .getSourceRange ()); 
C.emitReport (R) ; 
} 
void ReactorChecker: :eportDoubleSCRRAM (const CallEvent &Call, 
CheckerContext &C) const { 
ExplodedNode *ErrNode = C.generateSink() ; 
if (!ErrNode) 
return; 
BugReport *R = new BugReport (*DoubleSCRAMBugType, 
"Called a SCRAM procedure twice", ErrNode); 
R->addRange (Call .getSourceRange () ) ; 
C.emitReport (R); 


} 


上 述 代 码 首 先生 成 一 个 汇聚 节点 ， 这 意味 着 当前 分 析 可 达 程 序 状态 图 的 代码 路 径 被 检测 
到 一 个 严重 错误 ， 因 此 我 们 也 不 想 继续 分 析 该 路 径 。 下 一 行 代码 创建 一 个 BugReport 对 
象 ， 表 示 我 们 已 经 找到 一 个 新 的 类 型 为 DoubleonBugType 的 错误 ， 并且 可 以 自由 地 为 刚 
刚 创建 的 错误 节点 添加 相应 的 描述 信息 。 我 们 还 使 用 addRange( ) 成 员 函 数 来 标记 检测 到 
的 错误 在 源 代码 中 的 位 置 ， 并 将 其 显示 给 用 户 。 

添加 注册 代码 

为 了 使 静态 分 析 器 能 够 识别 我 们 创建 的 检查 器 ， 需 要 在 源 代码 中 定义 一 个 注册 函数 ， 然 
后 在 TableGen 文件 中 添加 该 检查 器 的 描述 信息 。 注 册 函 数 如 下 所 示 : 


void ento::registerReactorChecker (CheckerManager &mgr) { 
mgr.registerChecker<ReactorChecker>(); 


} 


TableGen 文件 有 一 个 检查 器 表 。 它 位 于 相对 于 Clang 源 文 件 夹 的 1ib/Staticanalyzer/ 
Checkers/Checkers .td 的 路 径 中 。 在 编辑 这 个 文件 之 前 ， 需 要 为 检查 器 选择 一 个 用 来 
包含 它 的 软件 包 ， 为 此 ， 我 们 选择 alpha .powerplant。 由 于 这 个 包 尚 不 存在 ,我 们 将 创 
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建 它 ， 这 需要 打开 checker .td 并 在 所 有 现 有 的 包 定义 之 后 添加 一 条 新 的 定义 语句 : 


def PowerPlantAlpha : Package<"powerplant">，InPackage<RALPha>: 


接 下 来 ， 添 加 新 编写 的 检查 器 : 


let ParentPackage = PowerPlantAlpha in { 


def ReactorChecker : Checker<"ReactorChecker">, 
HelpText<"Check for misuses of the nuclear power plant API">， 
DescFile<"ReactorChecker .cpp">; 


} // end "alpha.powerplant" 


如 果 使 用 CMake 来 构建 Clang， 则 应 将 新 的 源 文 件 添 加 到 Lib/Staticanalyzer/ 
Checkers/CMakeLists .txt 中 。 如 果 使 用 的 是 GNU 自动 工具 配置 脚本 ， 则 不 需要 修改 
任何 其 他 文件 ， 因 为 LLVM 自 带 的 Makefile 将 扫描 checkers 文件 夹 中 的 所 有 文件 ， 并 将 
其 链接 到 静态 分 析 器 的 检查 器 库 中 。 

构建 和 测试 

转 到 构建 LLVM 和 Clang 的 文件 夹 并 运行 make。 构 建 系 统 将 检测 你 的 新 代码 ， 并 构 
建 它 ， 然 后 将 其 与 Clang 静态 分 析 器 链接 。 构 建 完 成 之 后 ， 可 以 使 用 命令 clang -ccl 
-analyzer-checker-help 打印 所 有 有 效 的 检查 器 ， 你 应 该 会 发 现 新 编写 的 检查 器 位 列 
其 中 。 

下 述 代码 是 managereactor.c (与 之 前 的 例子 相同 )， 用 于 测试 我 们 的 检查 器 : 


int SCRRM () ; 
int turnReactoron () ; 


void test_loop (int wrongTemperature, int restart) { 
turnReactoron(); 
if (wrongTemperature) { 
SCRRM () ; 
} 
if (restart) { 
SCRAM () ; 
} 
turnReactoron(); 
// code to keep the reactor working 
SCRAM () ; 


} 
使 用 下 面 的 命令 行 可 以 用 我 们 的 检查 器 对 其 进行 分 析 : 


$ clang --analyze -Xanalyzer -analyzer-checker=alpha.powerplant 
managereactor.c 


检查 器 将 显示 存在 错误 的 路 径 并 退出 。 如 果 你 选择 输出 HTML 报告 ， 将 看 到 类 似 于 以 
图 9-10 的 错误 报告 。 
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int SCRAM(); 
int turnReactorOn(); 


void test loop(int wrongTemperature, int restart) { 
turnReactorOn( )}; 


turnReactoron(); 


// code to keep the reactor working 
SCRAM( ); 
} 





图 9-10 


现在 任务 已 经 完成 ， 我 们 已 经 成 功 开发 了 一 个 可 以 基于 路 径 敏 感性 自动 检查 是 否 违反 特 
定 API 规 则 的 程序 。 感 兴趣 的 读者 可 以 通过 阅读 其 他 检查 器 的 实现 ， 了 解 更 复杂 场景 下 检 
查 器 的 工作 原理 ， 或 者 查看 以 下 其 他 资源 以 获取 更 多 信息 。 


9.4 


可 以 利用 以 下 资源 获取 更 多 项 目 和 其 他 信息 : 


http://clang-analyzer.1llvm.org: 这 是 Clang 静态 分 析 器 项 目 页 面 。 
http://clang-analyzer.llvm.org/checker dev manual.html: 这 是 
一 个 有 用 的 指南 ， 它 为 需要 开发 检查 器 的 用 户 提 供 更 多 信息 。 
http://lcs.ios.ac.cn/~xzx/memmodel.pdf : 这 是 一 篇 由 Zhongxing Xu、 
Ted Kremenek 和 Jian Zhang 撰写 的 论文 (4 Memory Model for Static Analysis of C)， 
它 详细 介绍 了 在 检查 器 内 部 中 实现 的 内 存 模型 的 理论 知识 。 
http://clang.llvm.org/doxygen/annotated.html : 这 是 Clang 项 目的 
doxygen 文档 。 
http://llvm.org/devmtg/2012-11l/videos/Zaks-Rose-Checker24Hours. 
mp4 : 这 是 一 个 有 关 如 何 快 速 构建 一 个 检查 器 的 介绍 ， 由 Anna Zaks 和 Jordan Rose 
在 2012 年 LLVM 开发 者 大 会 上 发 表 。 
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9.5 总 结 


在 本 章 中 ， 我 们 探讨 了 Clang 静态 分 析 器 与 运行 在 编译 器 前 端的 简单 错误 检测 工具 的 不 
同 之 处 。 我 们 以 示例 说 明 静 态 分 析 器 更 准确 ， 但 其 准确 性 和 计算 时 间 之 间 存 在 权衡 关系 。 静 
态 分 析 器 具有 指数 时 间 复 杂 度 ， 完 成 分 析 需 要 太 长 时 间 ， 因 此 它 一 般 作为 独立 工具 工作 ， 而 
不 适合 集成 在 编译 器 流程 中 。 我 们 还 介绍 了 如 何 使 用 命令 行 界面 在 简单 项 目 上 运行 静态 分 析 
器 ， 以 及 使 用 名 为 scan-build 的 帮助 工具 来 分 析 大 型 项 目 。 最 后 ， 我 们 介绍 了 如 何 实现 
一 个 路 径 敏 感 的 错误 检查 器 ， 并 用 它 扩展 静态 分 析 器 。 

在 下 一 章 中 ， 我 们 将 介绍 构建 在 LibTooling 基础 结构 之 上 的 其 他 Clang 工具 ， 这 些 工 具 
可 以 帮助 我 们 方便 地 构建 代码 重 构 的 实用 程序 。 
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在 本 章 中 ， 我 们 将 介绍 各 种 可 以 处 理 C/C++ 程序 的 工具 ， 这 些 工具 都 把 Clang 前 端 当 
作 一 个 软件 库 来 使 用 。 具 体 而 言 ， 它 们 都 使 用 LibTooling 库 ， 该 Clang 库 人 允许 开 发 人 员 编写 
独立 的 工具 。 在 这 种 情况 下 ， 你 不 需要 将 你 的 工具 设计 成 符合 Clang 编译 流程 要 求 的 插件 ， 
而 可 以 使 用 Clang 的 解析 功能 将 该 工具 设计 成 独立 的 工具 ， 供 用 户 直 接 调 用 。 本 章 介绍 的 工 
具 可 以 在 Clang 外 部 工具 软件 包 中 找到 ; 有 关 如 何 安装 它们 的 信息 请 参阅 第 2 章 。 在 本 章 的 
末尾 ， 我 们 将 介绍 一 个 创建 你 自己 的 代码 重 构 工 具 的 实例 。 本 章 讨论 以 下 主题 : 

e 生成 编译 命令 数据 库 。 

e 了 解 和 使 用 一 些 依赖 LibTooling 的 Clang 工具 ， 如 Clang Tidy、Clang Modernizer、 

Clang Apply Replacement、ClangFormat、Modularize、PPTrace 和 Clang Query。 
e 构建 你 自己 的 基于 LibTooling 的 代码 重 构 工 具 。 


10.1 生成 编译 命令 数据 库 


编译 器 通常 是 从 诸如 Makefile 这 样 的 构建 脚本 中 被 调用 的 ， 构 建 脚本 包含 一 系列 用 于 
正确 配置 项 目 头 文件 和 定义 文件 的 参数 。 这 些 参 数 也 用 于 帮助 前 端 对 输入 的 源 文件 进行 正确 
的 词法 分 析 和 语法 分 析 。 然 而 在 本 章 中 ， 我 们 主要 研究 的 是 能 单独 运行 的 独立 工具 ， 而 不 是 
Clang 编译 流程 的 部 分 组 件 。 因 此 ， 理 论 上 我 们 需要 一 个 专门 的 脚本 来 以 正确 的 参数 对 每 个 
源 文件 运行 我 们 的 工具 。 

例如 ， 下 面 是 使 用 Make 从 LLVM 库 调用 编译 器 以 构建 一 个 典型 文件 的 完整 命令 行 : 


$ /usr/bin/c++ -DNDEBUG -D STDC CONSTANT MACROS -D STDC FORMAT MACROS 
-D_ STDC LIMIT MACROS -fPIC -fvisibility-inlines-hidden -Wall -W -Wno- 
unused-parameter -Wwrite-strings -Wmissing-field-initializers -pedantic 
-Wno-long-long -Wcovered-switch-default -Wnon-virtual-dtor -fno-rtti 
-I/Users/user/p/llvm/llvm-3.4/cmake-scripts/utils/TableGen -I/Users/ 
user/p/llvm/llvm-3.4/llvm/utils/TableGen -I/Users/user/p/llvm/llvm-3.4/ 
cmake-scripts/include -I/Users/user/p/llvm/llvm-3.4/llvm/include -fno- 
exceptions -o CMakeFiles/llvm-tblgen.dir/DAGISelMatcher.cpp.o -c /Users/ 
user/p/llvm/llvm-3.4/llvm/utils/TableGen/DAGISelMatcher .cpp 


在 使 用 这 个 库 时 ， 如 果 分 析 每 个 源 文件 都 需要 在 终端 输入 长 达 10 行 的 命令 ,显然 会 让 
人 觉得 非常 麻烦 ， 尤 其 是 前 端 需要 用 到 所 有 这 些 信息 ， 因 此 终端 命令 的 每 个 字符 都 不 能 丢弃 
或 者 出 错 。 

为 了 允许 工具 更 容易 处 理 源 代码 文件 ， 任 何 使 用 LibTooling 的 项 目 都 要 接受 一 个 命令 


数据 库 作为 输入 。 此 命令 数据 库 记 录 了 特定 项 目 中 各 个 源 文件 的 正确 编译 器 参数 。 更 为 简 
便 的 是 ， 我 们 可 以 使 用 加 上 -DCMAKE EXPORT COMPILE COMMANDS 标志 的 CMake 命 
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令 自动 生成 这 个 数据 库 文 件 。 例 如 ， 假 设 你 希望 在 Apache 项 目的 特定 源 文 件 上 运行 某 个 基 
于 LibTooling 的 工具 ， 为 了 避免 手动 传递 正确 解析 该 文件 所 需 的 确切 编译 需 标 志 ， 可 以 使 用 
CMake 通过 如 下 代码 生成 命令 数据 库 : 


$ cd httpd-2.4.9 

$ mkdir obj 

$ cd obj 

$ cmake -DCMAKE EXPORT COMPILE COMMANDS=ON ../ 
$ ln -s $(pwd)/compile commands.json ../ 


上 述 代码 与 通过 CMake 构建 Apache 所 使 用 的 命令 类 似 , 但 -DCMAKE_EXPORT_ 
COMPILE COMMANDS=ON 标志 指示 CMake 无 须 实际 构建 它 ， 而 是 用 编译 每 个 Apache 源 
文件 会 用 到 的 编译 器 参数 生成 一 个 JSON 文件 。 我 们 需要 在 Apache 根 文件 夹 中 创建 一 个 
JSON 文件 的 链接 。 在 此 之 后 ， 当 我 们 运行 任何 LibTooling 程序 来 解析 Apache 的 源 文件 时 ， 
它 将 查找 父 目 录 直 到 找到 compile commands.json， 并 用 合适 的 参数 解析 该 文件 。 

除 此 之 外 ， 如 果 不 想 为 你 的 工具 构建 编译 命令 数据 库 ， 则 可 以 使 用 双 短 划 线 ( --) 直接 
传递 用 于 处 理 此 文件 的 编译 器 命令 ， 这 对 于 只 需 少 量 编译 参数 的 项 目 非常 有 用 。 下 面 的 命令 
行 提 供 了 相应 的 示例 : 


$ my libtooling tool test.c -- -Iyour _ include dir -Dyour define 


10.2 clang-tidy 工具 


本 节 将 介绍 一 个 基于 LibTooling 库 的 工具 clang-tidy， 并 解释 其 使 用 方法 。 所 有 其 他 
Clang 工具 的 设计 和 用 法 都 与 其 类 似 ， 因 此 很 容易 上 手 。 

clang-tidy 工具 是 基于 Clang 的 代码 检查 工具 (linter)。 代 码 检 查 工具 一 般 负责 分 析 代 码 
并 找 出 编程 风格 不 合 规 的 部 分 。 它 可 以 检查 如 下 代码 特征 : 

e 代码 是 否 可 以 跨 不 同 的 编译 器 进行 移植 

e 代码 是 否 遵循 指定 的 习惯 用 法 或 约定 的 编码 风格 

e 代码 是 否 可 能 由 于 滥用 有 风险 的 语言 特性 而 导致 漏洞 

clang-tidy 工具 能 够 运行 两 类 检查 器 : 来 自 原始 Clang 静态 分 析 器 的 检查 器 ， 以 及 专 
为 clang-tidy 编写 的 检查 器 。 虽 然 二 者 都 是 通过 静态 分 析 对 程序 进行 检查 ， 但 clang-tidy 和 
其 他 基于 LibTooling 的 工具 是 在 源 代 码 层 进行 检查 ， 这 与 之 前 详细 描述 过 的 静态 分 析 器 中 
的 符号 执行 引 敬 不同。 这些 检 查 器 不 会 模拟 程序 的 执行 流程 ， 只 会 遍历 Clang 的 抽象 语法 
树 (AST)， 因 此 其 运行 速度 更 快 。 除 此 之 外 ，clang-tidy 中 的 检查 器 通常 负责 分 析 源 代码 是 
否 符合 特定 的 编码 惯例 ， 这 也 与 Clang 静态 分 析 器 不 一 样 。 具 体 而 言 ，clang-tidy 可 以 检查 
LLVM 编码 惯例 、Google 编码 惯例 以 及 其 他 常规 内 容 。 

如 果 你 有 意 遵循 特定 的 代码 风格 ， 你 将 发 现 使 用 clang-tidy 定期 检查 代码 非常 有 用 。 你 
ca 但 这 个 工具 目前 还 处 于 初级 阶 

， 只 完成 了 少量 测试 。 
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用 clang-tidy 检查 代码 


在 这 个 例子 中 ， 我 们 将 演示 如 何 使 用 clang-tidy 来 检查 第 9 章 中 编写 的 代码 。 该 代码 被 
设计 为 静态 分 析 器 的 插件 ， 如 果 我 们 想 将 其 提交 到 Clang 的 官方 源 代 码 仓 库 中 ， 则 需要 严格 
遵循 LLVM 的 代码 惯例 。 现 在 来 检查 我 们 是 否 确实 遵循 了 该 惯例 。 下 面 是 clang-tidy 的 通用 

令 行 界 面 。 


$ clang-tidy [options] <source0> [... <sourceN>] [-- <compiler command>] 


你 可 以 在 -checks 参数 中 通过 名 称 激活 对 应 的 单个 检查 器 ， 也 可 以 使 用 通配符 * 来 选 
择 以 相同 子 字 符 串 开头 的 多 个 检查 器 。 如 果 你 需要 禁用 检查 器 ， 只 需 在 检查 器 名 称 前 加 上 短 
划 线 即 可 。 例 如 ， 如 果 你 要 运行 所 有 有 关 LLVM 代码 惯例 的 检查 器 ， 可 以 使 用 以 下 命令 : 


$ clang-tidy -checks="llvm-*" file.cpp 


-AL 本章 介绍 的 所 有 工具 只 有 在 将 Clang 与 Clang 外 部 工具 项 目 (与 Clang 项 目 默 认 
是 分 离 的 ) 一 起 安装 的 情况 下 才 可 以 使 用 。 如 果 你 还 没有 安装 clang-tidy， 请 阅读 
第 2 章 以 获取 有 关 如 何 构建 和 安装 Clang 外 部 工具 的 说 明 。 


由 于 我 们 的 代码 是 与 Clang 一 起 编译 的 ， 因 此 需要 编译 器 命令 数据 库 。 下 面 首先 介绍 如 
何 生成 该 数据 库 。 请 转 到 LLVM 源 代码 所 在 的 文件 夹 ， 并 使 用 以 下 命令 创建 一 个 单独 的 文 
件 夹 来 保存 CMake 文件 : 

$ mkdir cmake-scripts 


$ cd cmake-scripts 
$ cmake -DCMAKE EXPORT COMPILE COMMANDS=ON ../llvm 


< 如 果 遇 到 unknown-source-file (未 知 源 文件 ) 错误 ， 并 且 它 指向 之 前 章节 中 
SN 创建 的 检查 器 代码 ， 则 需要 将 检查 器 的 源 文件 信息 添加 到 CMakeLists.txt 文件 中 。 
使 用 下 面 的 命令 行 来 编辑 这 个 文件 ， 然 后 再 次 运行 CMake 


$ vim ../llvm/tools/clang/lib/staticAnalyzer/Checkers/ 
CMakeLists.txt 


然后 ， 在 LLVM 根 文件 夹 中 创建 一 个 指向 编译 器 命令 数据 库 文件 的 链接 。 
$ ln -s $(pwd)/compile commands.json ../llvm 
现在 ， 可 以 运行 clang-tidy: 


$ cd ../llvm/tools/clang/lib/staticAnalyzer/Checkers 
$ clang-tidy -checks="llvm-*" ReactorChecker.cpp 


你 应 该 会 看 到 很 多 警告 信息 ， 内 容 涉及 检查 器 所 包含 的 头 文件 没有 严格 遵循 LLVM 代码 惯 
例 : 命名 空间 的 闭 括 号 后 应 加 上 注释 (请 参阅 http://llvm.org/docs/Codingstandards. 
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html#namespace-indentation)。, 


10.3 ”代码 重 构 工具 


本 节 将 介绍 利用 Clang 的 解析 能 力 来 完成 代码 分 析 和 源 代码 到 源 代码 转换 的 更 多 相关 工 
具 。 理 解 这 些 工具 会 比较 轻松 ， 因 为 它们 的 使 用 方式 类 似 于 clang-tidy， 均 依赖 命令 数据 库 
来 简化 其 使 用 。 


10.3.1 Clang Modernizer (代码 转换 器 ) 


Clang Modernizer 是 一 个 革命 性 的 独立 工具 ， 它 帮助 用 户 将 老 版 本 的 C++ 代码 转换 为 诸 
如 C++ 11 等 最 新 标准 的 代码 。 它 主要 依靠 以 下 变换 : 

e 循环 替换 变换 : 它 将 老 版 本 C 风格 的 for ( ; ; ) 循环 转换 为 较 新 版 本 的 基于 范围 的 循 
环形 式 for (auto &...:..)。 
nullptr 替换 变换 : 它 将 把 使 用 NULL 或 常量 0 来 表示 空 指针 的 老 版 本 C 风格 代码 
变换 成 使 用 C++ 11 中 新 的 关键 字 nullptr。 
auto 替换 变换 : 它 在 特定 情况 下 使 用 auto 关键 字 替 换 某 些 类 型 声明 语句 ， 从 而 提 
高 代码 的 可 读 性 。 
添加 override 变换 : 它 将 override 说 明 符 添 加 到 重 写 基 类 函数 的 虚拟 成 员 函 数 
声明 语句 。 
按 值 传递 替换 变换 : 它 使 用 按 值 传递 的 惯用 法 来 蔡 换 在 const 引用 后 执行 复制 操作 
的 情况 。 

e auto_ptr 替换 变换 : 它 使 用 std: :unique_ptr 替代 废除 的 std: :auto_ptr。 

Clang Modernizer 是 使 用 Clang LibTooling 基础 架构 实现 的 源 代 码 转 换 工 具 中 比较 成 功 
的 案例 。 请 参考 以 下 模板 来 调用 它 : 


$ clang-modernize [<options>] <source0> [... <sourceN>] [-- <compiler 
command>] 


注意 ， 如 果 除 了 源 文件 名 之 外 没有 提供 任何 额外 的 选项 ， 该 工具 将 直接 在 源 文件 上 执行 
上 述 变 换 操 作 。 你 可 以 使 用 -serialize-replacements 标志 将 修改 建议 写 和 硬盘， 这 
样 就 可 以 在 应 用 这 些 变 换 之 前 进行 查看 。 我 们 下 面 将 介绍 一 个 可 以 将 硬盘 中 存储 的 代码 转换 
建议 应 用 到 源 代码 的 特殊 工具 。 


10.3.2 ”Clang Apply Replacements (替换 执行 器 ) 


Clang Modernizer (以 前 称 为 C++ migrator) 的 诞生 引发 了 如 何在 大 型 代码 库 上 协调 源 代 
码 转换 的 讨论 。 其 中 一 个 坏 手 的 问题 是 ， 当 分 析 不 同 的 转换 单元 时 ， 可 能 存在 多 次 分 析 同 一 
头 文件 的 情况 。 

解决 该 问题 的 一 个 方法 是 序列 化 修改 建议 ， 并 将 它们 写 入 文件 中 。 另 外 一 个 工具 将 负 
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责 读 取 这 些 建 议 文件 ， 丢 弃 有 冲突 和 重复 的 建议 ， 并 将 修改 建议 应 用 于 源 文件 。 为 了 辅助 
Clang Modernizer 处 理 大 型 代码 库 ，Clang Apply Replacements 应 运 而 生 。 

产生 修改 建议 的 Clang Modernizer 和 执行 这 些 建议 的 Clang Apply Replacement 都 使 用 
clang::tooling::Replacement 类 的 序列 化 版 本 。 该 序列 化 使 用 YAML 格式 ， 该 格式 
定义 为 一 个 更 适合 阅读 的 JSON 超 集 。 

准确 来 说 ， 代 码 修改 工具 使 用 的 补丁 文件 也 是 修改 建议 的 一 种 序列 化 形式 , 但 Clang 开 
发 人 员 选 择 使 用 YAML 并 利用 Replacement 类 的 序列 化 版 本 ， 因 此 无 须 解 析 补 丁 文件 。 

由 此 可 见 ，Clang Apply Replacements 工具 并 未 设计 成 一 个 通用 的 代码 修补 工具 ， 而 是 

一 个 只 负责 提交 由 依赖 于 工具 API 的 Clang 工具 所 做 修改 的 专用 工具 。 需 要 指出 的 是 ， 如 果 

要 编写 源 代码 到 源 代码 转换 工具 ， 只 有 当 需 要 协调 多 个 修改 建议 并 检查 重复 修改 时 才 需 要 使 
用 Clang Apply Replacements， 否则 只 需 直 接 修补 源 文件 即 可 。 

要 使 用 Clang Apply Replacements， 首 先 需要 使 用 Clang Modernizer 并 将 它 设置 为 对 修 
改建 议 执行 序列 化 。 假 设 我 们 想 要 将 下 面 的 C++ 源 文件 test .cpp 转换 成 使 用 更 新 的 C++ 
标准 : 


int main() { 
const int size = 5; 
int aref = {1.2,3,475}: 
for (int i = 0; i < size; ++i) { 
arr[i] += 5; 


return 0; 


} 


根据 Clang Modernizer 的 用 户 手 册 ， 将 此 循环 转换 为 使 用 较 新 的 auto 迭代 器 是 安全 
的 。 为 此 我 们 调用 其 循环 变换 : 


$ clang-modernize -loop-convert -serialize-replacements test.cpp 
--Serialize-dir=./ 


最 后 一 个 参数 是 可 选 的 ， 它 指定 使 用 当前 文件 夹 来 存储 包含 修改 建议 的 文件 。 如 果 不 指 
定 该 参数 ， 该 工具 将 创建 一 个 用 于 存储 该 文件 的 临时 文件 夹 。 在 将 所 有 修改 建议 文件 都 转 储 
到 当前 文件 夹 之 后 ， 即 可 开始 分 析 生 成 的 YAML 文件 。 要 将 修改 建议 应 用 于 源 文件 ， 只 需 
使 用 当前 文件 夹 作为 唯一 参数 运行 clang-apply-replacements: 


$ clang-apply-replacements ./ 


~ 二、 运行 此 命令 后 ， 如 果 得 到 错误 消息 “ trouble iterating over directory ./: too many levels 
2 of poli links”"， 可 以 使 用 /tmp 作为 存储 替换 文件 的 文件 夹 再 重 试 最 后 两 条 命 
。 也 可 以 创建 一 个 新 目录 来 保存 这 些 文件 ， 方 便 之 后 对 这 些 文件 进行 分 析 。 


这 些 工 具 通常 被 用 于 对 大 型 代码 库 进行 分 析 ， 而 不 是 上 面 这 种 简单 的 例子 。 因 此 ， 
Clang Apply Replacements 不 会 提出 任何 问题 ， 而 是 直接 开始 解析 你 指定 的 文件 夹 中 所 有 可 
用 的 YAML 文件 ， 分 析 并 应 用 这 些 变换 操作 。 
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你 甚至 可 以 指定 该 工具 修补 源 文 件 时 需要 遵循 的 代码 风格 ， 对 应 功能 的 标志 为 -style= 
<LLVM|Google|Chromium|Mozilla|Webkit>。 这 个 功能 是 由 LibFormat 库 提供 的 ， 
它 允 许 任何 重 构 工具 以 特定 的 格式 或 编码 惯例 生成 所 需 代码 。 我 们 将 在 下 一 节 介 绍 关 于 这 个 
特性 的 更 多 细节 。 


10.3.3 ”ClangFormat (格式 化 工具 ) 


假设 你 是 一 个 类 似 于 国际 C 混淆 代码 竞赛 (IOCCC ) 的 评委 。 为 了 帮助 你 理解 竞赛 的 
内 容 ， 我 们 在 这 里 转载 了 第 二 十 二 届 比 赛 的 获胜 者 之 一 Michael Birken 的 代码 。 此 代码 在 
Creative Commons Attribution-ShareAlike 3.0 版 本 许可 下 获得 授权 ， 这 意味 着 只 要 你 保留 了 
IOCCC 的 许可 证 ， 就 可 以 自由 对 其 进行 修改 ， 如 图 10-1 所 示 。 


器 | 4 | 国 obfc)》NosSelection 
FEharm = ™ /es; 





#include <stdio.h> 

#define m 21 

#define o(l, k) for(l=9; \l<k; 1l++) 
#define n(k) olT, k) 


int E,L,0,R,G[42] (m],h{2] [42] [m] ,9g[3] [8],c 
[42] [42] [2] , f[42]; char d[42]; void v( int 
b,int a,int j){ printf("\33 [%d;%df\3314%d" 
nm ",a,b,j); } void u(){ int T,e; n(42)o( 
emjifth[6] IT] [el]—h{1] [T] [le]){ v(e+4+e,T+2 
»h[0] [T] [el]+1?h[9] [T] [e] :8); h[1] [T] {el}=h[ 
BJ]IT] [el]; } fflush(stdout); } void qlint 1 
,int k,int p){ 
int T,e,a; L=0 
; 0=1; while(0 
){ nNn(455L){ e= 
k+c[l] [TT] [0]; 
h[e] [L-1+c[UT 
T] [1]] [p726-~e: 
e]=-1; } n(4){ 
1]+1; if(a==42 
; } } n(4){ e= 
T] [1]] [p?20-e: 
ut); } n(42) { 
ola, mebe==m){ 
]=h[8] [L-1] [a 


e=k+c[L [T] [9] ; a=L*c{l] [T] [ 
1| hl9] [a] [p?20-e:e]+1){ 0=9 
k*+c[1] [T] [0]; h[el [L + c[UT 
el=g[1] [f[p?19+l:1]]; } L++; 
of(e,m)if(h[9] [T) [elj<6)break; 
for(L=T; Li L 一 ) { h[9] [L] [a 
]; } h[9] [9] [al]=-1; } } u(); 


Jint main(){ int T,e,t,r,i,s 
1] [T]=7-T; R—; n(42) ole,m) 
R; n(17){ e=d[T]-48; d[T]=9; 
} } n(8)if(g[8] [7-T]){ t=g[i 
“~ g[2] [g[i] [T]]=T; n(R+i)ole,m 


sD,V,K; printf("\33[2)\33[?251"); n(8)g[i= 
GIT] [e]—; while(fgets(d,42, stdin)) { r=++ 
if ((e&7)==e) { g[6] [el ++; G[R] [T+2]=e; } 
][0]; gli] [0++]=g[i] [T]; 9g[il[ITJj=t; } n(8) 
Jif(GIT] Ie G[T] [el=g [2] [GIT] [el]]; n(19 


Jo(t,2){ f[IT+t+T]=(TI"+, 4" 
[e] [t]=("5'<$=$8)Ih$=h9i8'9" 


TNX"]-35)>>t*3&7; o(e,4){ c[T] 
en [T+t+T] -35)>>ex*253; 
} } n(15) { s=T>97m:(T&3)-3715:;36;o(e,s)o(t,2)c[T+19] [e] [t]="6*6, 8*+6.608.6264826668\ 
865:: (+;0(6+6-6/8,61638965678469. ;88) )()3(6,8*6.608.6264826668865:+;4)-*6-6/616365, \ 
-6715698.5; ,89,81+, (823096/:40(8-7751)2)65;695(855(+*8)+;4**+4(((6.608.626482666886\ 
5:+;4+4)9(8)6/61638065678469. ;88) -4,4*8+4{( (60{/6264826668865:+;4-616365676993-9:54\ 
4—14).;./347.+18*):1; -#8-975/)936. +:4*,80987(887(@(#)4.*""/4, 4#8+4({ (6264826668865: \ 
+34/4-41+8-4)8(8)6365678469. ;88)1/(6*6,6.60626466686:8)8-8*818.8582/9863(+;/""*6,6.6\ 
8626466686:4(8)8-8*818.8582/9863(+;/,6.680626466686:8-818.8582/9864*4+4(9())+;/.60662\ 
64666586:8/8388/7844,4-4*4+4(8())69+;/9626466686:818582/9864.4/4,4-4*4+4(0())+;" [e+E 
+e+t]-49; E+=s+s; } n(45){ if(T>i) { v(2,T,7); v(46,T,7); } v(2+T,44,7); } T=0; ole, 
42)o(t,m)h[T] [ej[t]—; while(R+i) { s = D=8; if (r-R) { n(19) if (G[R+i][T]+i) V=T/2 
; else if(G[IR][T]+i) s++; if(s) { if(V>4){ V=9-V; D++; } V+=29; n(26) q(c[V] IT] [0],c 
[VI [T] [i] ,0); } } n(19) if((L=6[R] [T] )+i) { 0=T-L; e=0>9; t=e?18-0 :0; ofK,((ts3)-37 
16:37)){ if(K){ L=c[t+19] [K-i [9]; 0=c[t+19] [K-i] [i] ; } q(L,O,K SK e); } } if(s) ql 
clv] [28] [8], cI{V]) [28] [i], D); R 一 ; } printf("\33147;1f\331725h\33[46m"); return 8; } 





图 10-1 


你 可 能 会 感到 疑惑 ， 但 这 确实 是 有 效 的 C 代码 ， 可 以 从 http://www.ioccc.org/2013/ 
birken 下 载 它 。 现 在 让 我 们 通过 该 例子 来 演示 ClangFormat 可 以 做 什么 


$ clang-format -style=llvm obf.c -- 


图 10-2 显示 结果 。 
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器 | 4 Pp | 圈 de-obf.c 》 No Selection 
Fhar i 





Wp 
#include taio, h> 
#define 
sdefine at Kk) for (\ = 8; \ < ki t+) 
sdefine n(k) o(T, k) 


int E, L, 0, R, G142] [Im] hl2] {42]{m], gl3] [8], c{42]{42] [2], f[42]; 
char 41421; 
0 void vin int a, int j) { 
| printf( me Wdf\33 [4hd" 
| mm 
a, b, 3); 
} 
void uy() 1 
nt T， 
qe ots, a if {hte) [tr] le] - hE [el) { 
十 本 二 el IT] +13?h9l[TIIel : 0); 
Me i - 2 ht9 [IT [el; 
ffLush(stdout); 
中 二 全 EN 5 int k, int p) { 
= Ee 


0= 
A (0) { 
n(4 &5 1) { 


e=k*» cll 0); 
helIL -1+ <cIUITIIIIIp 7 20 -ee :el = -1; 


Wo 
e=k+ctITIe; 
a=L+clITII] 
be 21 nto 7 20 - e:e]*1)1 


e=k+* cll[lT [0]; 
y h[el[L + clUITIIIIIJtp?26-e:el=gflflp?19+1:1U]; 





L+A+7 
vu(); 
图 10-2 


上 述 代 码 的 风格 显然 更 便于 理解 。 在 现实 生活 中 ， 虽 然 我 们 很 幸运 地 不 需要 阅读 故意 混 
消 的 代码 ， 但 是 严格 遵守 某 个 编码 规范 也 是 比较 烦琐 的 事情 。ClangFormat 的 目标 就 是 格式 
化 代码 以 符合 指定 的 代码 惯例 。 它 既 可 以 是 一 个 单独 的 工具 ， 也 可 以 是 一 个 LibFormat 库 。 
如 果 你 要 创建 的 工具 刚好 可 以 生成 C 或 C++ 代码 ， 就 可 以 将 注意 力 集中 到 项 目 本 身 ， 而 将 
格式 化 问题 留 给 ClangFormat 解决 。 

除了 对 上 述 人 为 构造 的 例子 进行 代码 展开 和 缩 进 ，ClangFormat 工具 还 可 以 找到 最 好 的 
方式 将 代码 转换 成 每 行 不 超过 80 个 字符 的 格式 ， 从 而 提高 其 可 读 性 。 如 果 你 曾经 考虑 过 切 
割 长 句 的 最 好 方法 ， 你 会 感叹 ClangFormat 在 这 个 任务 上 完成 得 有 多 好 。 建 议 你 在 自己 喜爱 
的 编辑 器 上 配置 该 工具 并 设置 一 个 热 键 来 启动 它 。 如 果 你 使 用 诸如 Vim 或 Emacs 等 常用 编 
辑 器 ， ee erin aa ClangFormat。 

有 关 代 码 的 格式 化 、 组 织 和 清晰 性 的 话题 也 给 我 们 带 来 了 C 和 C++ 代码 中 环 手 的 问题 : 
头 文件 的 滥用 ei 们 。 我 们 将 专门 在 下 一 小 节 中 讨论 针对 该 问题 的 一 个 正在 完善 
中 的 解决 方案 ， 以 及 可 以 帮助 你 使 用 该 新 方案 的 Clang 工具 。 


10.3.4 _ Modularize (模块 化 工具 ) 


为 了 理解 模块 化 工具 Modularize， 我 们 首先 介绍 C 和 C++ 中 的 模块 概念 ， 在 撰写 本 书 
时 ， 模 块 还 没有 正式 标准 化 。 对 这 个 概念 的 解释 稍微 偏离 了 本 章 的 主题 ， 对 当前 Clang 如 何 
在 C/C++ 项 目 中 实现 这 个 新 概念 不 感 兴趣 的 读者 可 以 跳 过 本 节 ， 继 续 阅 读 下 一 小 节 中 的 工 
有 具 介 绍 。 


10.3.4.1 了 解 C/C++ API 的 定义 

C 和 C++ 程序 通常 分 为 头 文件 (比如 扩展 名 为 .h 的 文件 ) 和 实现 文件 (比如 扩展 名 
为 .c 或 .cpp 的 文件 )。 编 译 器 将 实现 文件 和 它 引 用 的 所 有 头 文件 的 每 个 组 合 视 为 一 个 单独 
的 翻译 单元 。 

当 用 C 或 C++ 编程 时 ， 如 果 你 正在 处 理 特定 的 实现 文件 ， 需 要 推断 哪些 实体 属于 局 部 
范围 ， 哪 些 实体 属 于 全 局 范围 。 例 如 ,在 C 语言 中 不 能 在 不 同 实现 文件 之 间 共 享 的 函数 或 
数据 声明 应 该 使 用 关键 字 static， 或 者 在 C++ 中 应 该 声明 于 匿名 的 命名 空间 中 。 它 告 ; 
链接 器 该 翻译 单元 不 会 导出 这 些 本 地 实体 ， 因 此 这 些 实体 不 能 被 其 他 单元 使 用 。 

但 是 ， 如 果 你 希望 跨 多 个 翻译 单元 共享 实体 ， 则 会 出 现 一 些 问题 。 为 了 更 清楚 地 解 
释 ， 我 们 将 导出 实体 的 翻译 单元 称 为 导出 单元 ， 而 使 用 这 些 实体 的 单元 为 导入 单元 。 我 们 
假设 名 为 gamelogic.c 的 导出 单元 想 要 将 一 个 名 为 num_1lives 的 整数 变量 导出 到 名 为 
screen.c 的 导入 单元 中 。 

链接 器 的 功能 

我 们 首先 展示 链接 器 如 何 处 理 上 述 例子 中 的 符号 导入 。 在 编译 和 汇编 gamelogic.c 
之 后 ， 我 们 将 得 到 一 个 名 为 gamelogic.o 的 目标 文件 ， 其 中 有 一 个 符号 表 说 明 符 号 num_ 
lives 占用 4 个 字 节 ， 可 供 其 他 翻译 单元 使 用 。 


$ gcc -c gamelogic.c -o gamelogic.o 


$ readelf -s gamelogic.o 


Num Value Size Type Bind Vis Index Name 
7 00000000 4 OBJECT GLOBAL DEFAULT 3 num lives 


上 表 省 略 了 我 们 不 感 兴趣 的 其 余 符号 信息 。 示 例 中 的 readelf 工具 只 适用 于 Linux 
平台 中 广泛 采用 的 ELF 格式 (Executable and Linkable Format， 可 执行 和 可 链接 格式 )。 对 
于 其 他 平台 ， 你 可 以 使 用 objdump -t 打印 符号 表 。 上 图 中 符号 表 解 释 如 下 : 符号 num_ 
lives 被 分 配 在 表 中 的 第 7 个 位 置 ， 并 且 占 据 了 相对 于 索引 3 ( .bss 段 ) 部 分 的 第 一 个 地 
址 (对 应 偏 移 量 为 零 )。.bss 段 依次 保存 将 被 初始 化 为 零 的 数据 实体 。 要 验证 段 名 称 和 索引 
之 间 的 对 应 关系 ， 请 使 用 readelf -8 或 objdump -h 打印 内 存 段 的 头 信 息 。 该 表 还 说 
明了 num_lives 符号 是 一 个 占有 4 个 字 节 大 小 的 〈 数 据 ) 对 象 ， 并 且 是 全 局 可 见 的 (全 局 
绑 定 )。 

同样 ，screen.o 文件 也 将 有 一 个 符号 表 ， 该 表 会 说 明 此 翻译 单元 依赖 于 男 一 个 翻译 单 
元 中 的 符号 num_1ives。 我 们 将 使 用 相同 的 命令 进行 分 析 : 

$ gcc -Cc Screen.c -oO screen.o 


$ readelf -s screen.o 


Num Value Size Type Bind Vis Index Name 
10 00000000 0 NOTYPE GLOBAL DEFAULT UND num lives 


该 条 目 类 似 于 之 前 导出 单元 中 所 看 到 的 内 容 ， 但 其 信息 更 少 。 它 没有 大 小 或 类 型 信息 ， 
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并 且 对 应 于 ELF 字段 的 索引 信息 为 UND ( 即 undefined， 未 定义 )， 这 说 明 该 翻译 单元 是 导 
和 人 单元。 如 果 最 终 的 程序 包含 导 和 单元， 链接 器 将 负责 解决 其 依赖 关系 。 

链接 器 接收 这 两 个 目标 文件 作为 输入 ， 并 使 用 导出 单元 中 所 包含 的 地 址 信息 来 修补 导入 
单元 ， 以 解决 二 者 的 依赖 关系 。 


$ gcc Screen.o gamelogic.o -o game 


$ readelf -s game 


Num Value Size Type Bind Vis Index Name 
60 0804a01c 4 OBJECT GLOBAL DEFAULT 25 num lives 


上 表 中 的 值 反 映 了 程序 加 载 时 该 变量 的 完整 虚拟 内 存 地 址 ， 从 而 可 以 将 符号 的 地 址 提供 
给 导入 单元 的 代码 段 ， 这 样 就 完成 了 两 个 不 同 翻译 单元 之 间 的 导出 导 人 协议 。 

通过 上 述 例子 ， 我 们 可 以 得 出 结论 : 通过 链接 器 可 以 简单 而 有 效 地 实现 多 个 翻译 单元 之 
间 的 实体 共享 。 

前 端 支持 

高 级 语言 的 处 理 要 比 目 标 文件 的 处 理 更 为 复杂 。 与 链接 器 的 处 理 不 同 ， 编 译 器 不 能 只 依 
赖 导入 实体 的 名 称 来 处 理 导 入 单元 ， 因 为 它 需 要 验证 该 翻译 单元 的 语义 没有 违反 语言 的 类 型 
系统 ， 例 如 ， 它 需要 确保 num_1ives 变量 是 一 个 整数 类 型 。 因 此 除了 导入 实体 的 名 称 ， 编 
译 器 还 需要 其 类 型 信息 。 一 般 而 言 ，C 程序 通过 请 求 头 文件 来 解决 这 个 问题 。 

头 文件 包含 类 型 声明 以 及 将 在 不 同 翻译 单元 中 使 用 的 实体 的 名 称 。 在 这 种 模型 中 ， 导 人 
单元 使 用 include 编译 指令 来 加 载 它 要 导入 的 实体 的 类 型 信息 。 然 而 ， 头 文件 的 灵活 设计 
使 得 它 不 止 具有 声明 的 功能 ， 实 际 上 它 还 可 以 包含 任何 C 或 C++ 代码 。 

依赖 C/C++ 预 处 理 器 的 问题 

与 Java 等 语言 中 的 Import 指令 不 同 ，include 指令 的 语义 不 限于 为 编译 器 提供 导入 
符号 所 需 的 信息 ， 实 际 上 它 更 多 地 被 用 于 扩展 C 或 C++ 代码 。 这 种 机 制 是 由 预 处 理 器 实现 
的 ， 它 在 实际 编译 之 前 简单 地 复制 和 扩展 代码 ， 这 种 盲目 的 处 理 方式 几乎 与 文本 处 理工 具 
一 和 

在 C++ 代码 中 ， 这 种 代码 膨胀 的 问题 更 加 复杂 ， 因 为 C++ 的 模板 鼓励 把 一 个 模板 类 的 
完整 实现 放 在 头 文件 中 。 这 将 导致 所 有 使 用 该 头 文件 的 导入 单元 中 被 注入 大 量 额 外 的 C++ 
代码 。 

上 述 问题 给 有 大 量 外 部 依赖 库 (或 外 部 定义 的 实体 ) 的 C 或 C++ 项 目的 编译 带 来 很 大 
的 额外 负担 ， 因 为 编译 器 需要 重复 解析 大 量 头 文件 : 每 个 使 用 头 文件 的 编译 单元 都 需要 解析 
一 次 。 

回忆 一 下 ， 实 体 导 入 和 导出 本 可 以 通过 扩展 的 符号 表 来 解决 ， 但 是 现在 需要 仔细 解析 数 
千 行 手动 编写 的 头 文件 。 

大 型 编译 器 项 目 通常 使 用 预 编 译 头 文件 的 方法 来 避免 头 文件 的 重复 解析 问题 ， 例 如 ， 
Clang 项 目 中 的 PCH 文件 。 然 而 ， 这 种 方法 只 是 暂时 缓解 了 该 问题 ， 编 译 器 仍然 需要 为 了 


可 能 存在 的 未 知 安定 义 而 重新 解析 整个 头 文件 ， 这 同样 也 会 影响 当前 翻译 单元 对 待 该 头 文件 
的 方式 。 
例如 ， 假 设 我 们 的 游戏 按 以 下 方式 实现 gamelogic.h: 


#ifdef PLATFORM A 

extern uint32 t num lives; 
#else 

extern Uint16 t num lives; 
#endif 


当 screen.c 导 和 上述 头 文件 时 ， 导 入 实体 num_1lives 的 类 型 取决 于 该 翻译 单元 
的 上 下 文 背景 中 是 否定 义 了 宏 PLATFORM RA。 此 外 ， 这 个 上 下 文 背景 对 于 另 一 个 翻译 单元 
可 能 是 不 同 的 。 这 会 强制 编译 器 在 每 次 不 同 的 翻译 单元 包括 该 头 文件 时 都 加 载 其 中 的 额外 
代码 。 

为 了 解决 C/C++ 头 文件 导 人 的 问题 以 及 优化 库 接 口 的 编写 ， 模 块 提 供 了 描述 该 接口 的 
新 方法 ， 并 成 为 目前 标准 化 议程 的 一 部 分 。 另 外 ，Clang 项 目 已 经 实现 了 对 模块 的 支持 。 

10.3.4.2 ”理解 模块 的 工作 原理 

模块 定义 了 一 个 使 用 特定 软件 库 的 清晰 而 无 歧义 的 接口 ， 翻 译 单元 可 以 用 导入 模块 来 代 
替 导 和 人 头 文件 。 导 和 指令 import 将 加 载 由 给 定 库 导出 的 实体 ， 而 不 会 向 当前 编译 单元 注 
和 人 额外 的 C 或 C++ 代码。 

但 是 ， 目 前 模块 导入 语 法 还 未 被 标准 化 ， 这 仍然 是 C++ 标准 化 委员 会 的 讨论 内 容 之 一 。 
为 此 ，Clang 允许 你 传递 一 个 名 为 -fmodules 的 额外 标志 ， 当 你 导入 的 头 文件 属于 支持 模 
块 的 库 时 ，Clang 会 把 include 编译 指令 解析 为 模块 的 import 指令 。 

当 解 析 属 于 某 个 模块 的 头 文件 时 ，Clang 将 产生 一 个 具有 预 处 理 器 干净 状态 的 它 自己 的 
实例 来 编译 这 些 头 文件 ， 并 以 二 进 制 形式 缓存 结果 ， 以 便 更 快 地 编译 将 导 和 人 同一 模块 的 后 续 
其 他 翻译 单元 。 因 此 ， 模 块 中 的 头 文件 不 应 该 依赖 于 任何 预先 定义 的 宏 或 预 处 理 器 的 任何 先 
前 状态 。 

10.3.4.3 ”使 用 模块 

要 将 一 组 头 文件 映射 到 一 个 特定 模块 ， 可 以 定义 一 个 名 为 module.modulemap 的 
独立 文件 ， 由 该 文件 提供 这 些 信息 ， 并 且 应 该 将 它 放 在 定义 软件 库 API 的 头 文件 所 在 的 相 
同文 件 夹 中 。 如 果 该 文件 存在 并 且 通 过 -fmodules 调用 Clang， 编 译 器 将 使 用 模块 进行 
编译 。 

让 我 们 扩展 之 前 的 简单 游戏 例子 以 使 用 模块 。 假 设 游 戏 API 被 定义 在 两 个 头 文件 
gamelogic.h 和 screenlogic.h 中 。 主 文件 game .c 从 两 个 文件 中 导入 实体 。 我 们 的 
游戏 API 源 代码 的 内 容 如 下 : 

e gamelogic.h 文件 的 内 容 : 


extern int num lives; 


e screenlogic.h 文件 的 内 容 : 
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extern int num lines; 


e gamelogic.c 文件 的 内 容 : 


int num lives = 3; 


e screenlogic.c 文件 的 内 容 : 


int num lines = 24; 


此 外 ， 在 我 们 的 游戏 API 中 ， 只 要 用 户 包 括 gamelogic.h 头 文件 ， 它 还 会 导入 
screenlogic.h 以 便 在 屏幕 上 打印 游戏 数据 。 因 此 ， 我 们 将 根据 这 种 依赖 关系 来 构建 我 
们 的 逻辑 模块 。 项 目的 module.modulemap 文件 定义 如 下 : 


module MyGameLib { 
explicit module ScreenLogic { 


header "screenlogic.h" 


explicit module GameLogic { 
header "gamelogic.h" 
export ScreenLogic 
} 
} 


关键 字 module 的 后 面 是 用 来 识别 它 的 名 称 ， 即 示例 中 的 MyGameLib。 每 个 模块 都 可 
以 包含 一 些 子 模块 。 关 键 字 explicit 用 于 告知 Clang : 只 有 当 它 的 某 一 个 头 文件 被 显 式 包 
括 时 才 导 入 该 子 模块 。 之 后 我 们 使 用 header 关键 字 来 声明 该 子 模块 中 包含 的 C 头 文件 。 在 
上 述 例子 中 ， 每 个 子 模块 只 声明 一 个 头 文件 ， 但 你 可 以 根据 项 目 实际 情况 定义 多 个 头 文件 。 

使 用 模块 可 以 简化 项 目的 构建 过 程 ， 也 使 ijnclude 指令 更 加 简单 。 这 里 需要 指出 的 
是 ，GameLogic 子 模块 中 存在 一 条 使 用 关键 字 export 修饰 Screenlogic 子 模块 名 称 
的 语句 ， 这 表示 如 果 用 户 导 人 了 GameLogic 子 模块 ， 则 自动 导入 ScreenLogic 子 模块 ， 
使 该 子 模块 中 的 符号 同样 可 见 。 

为 了 演示 这 一 点 ， 我 们 将 编写 作为 上 述 API 用 户 的 game .c， 如 下 所 示 : 


// File: game.c 

#include "gamelogic.h" 

#include <stdio.h> 

int main() { 
printf ("lives= %d\nlines=%d\n'", num lives, num lines); 
return 0; 


} 

请 注意 ， 该 文件 使 用 了 在 gamelogic.h 中 定义 的 符号 num_ lives 和 在 screenlogic.h 
中 定义 的 num_ lines， 但 后 者 并 没有 被 显 式 包 括 。 但 当 使 用 带 有 -fmodules 标志 的 
clang 解析 此 文件 时 ， 它 将 转换 第 一 个 include 指令 ， 使 其 等 同 于 使 用 import 指令 导 
入 GameLogic 子 模块 ， 因 此 ，ScreenLogic 中 定义 的 符号 也 会 自动 被 导入 。 下 面 的 命令 
行 应 该 可 以 正确 地 编译 这 个 项 目 : 


$ clang -fmodules game.c gamelogic.c screenlogic.c -0o game 


另 一 方面 ， 在 没有 模块 系统 的 情况 下 调用 Clang 会 导致 它 报告 丢失 符号 定义 : 


$ clang game.c gamelogic.c screenlogic.c -0o game 


Screen.c:4:50: error: use of undeclared identifier 'num lines'; did you 
mean 'num lives'? 


printf ("lives= %d\nlines=%d\n", num lives, num lines); 


但 是 ， 如 果 和 希望 你 的 项 目 具 有 可 移植 性 ， 我 们 建议 你 尽 可 能 地 避免 将 项 目 设计 成 只 能 在 
具有 模块 系统 的 场景 下 工作 ， 即 你 的 项 目 在 没有 模块 系统 下 也 应 该 可 以 编译 。 模 块 的 最 佳 使 
用 场景 是 用 于 简化 对 库 API 的 使 用 ， 并 提高 依赖 于 许多 共同 头 文件 的 翻译 单元 的 编译 速度 。 

10.3.4.4 了 解 Modularize 

这 里 我 们 推荐 一 个 可 以 进一步 了 解 模块 思想 的 练习 : 将 一 个 现 有 大 型 项 目 从 使 用 头 文件 
变更 为 使 用 模块 。 需 要 特别 注意 的 是 ， 在 模块 框架 中 ， 每 个 子 模块 中 的 头 文件 是 独立 编译 
的 。 因 此 ， 如 果 某 个 头 文 件 依赖 于 导入 它 之 前 在 其 他 文件 中 定义 的 宏 ， 则 无 法 移植 到 使 用 模 
块 的 形式 。 

Modularize 的 目的 就 是 帮 我 们 解决 上 述 问 题 。 它 可 以 分 析 一 组 头 文件 ， 报 告 这 些 头 文件 
是 否 存在 重复 的 变量 定义 或 安定 义 ， 以 及 是 否 存在 由 于 不 同 预 处 理 器 状态 而 导致 不 同 计算 结 
果 的 宏 定 义 。 这 些 信 息 可 以 帮助 你 诊断 把 一 组 头 文件 移植 成 模块 时 会 遇见 的 常见 障碍 。 除 此 
之 外 ，modularize 还 会 检测 在 某 个 命名 空间 块 内 使 用 的 include 指令 的 情况 ， 因 为 该 指令 
会 强制 编译 器 根据 不 同 的 上 下 文 背 景 解析 被 包含 的 文件 ， 而 这 与 模块 的 概念 是 不 兼容 的 : 头 
文件 中 定义 的 符号 不 能 依赖 于 包含 头 文件 的 上 下 文 背 景 。 

10.3.4.5 ”使 用 Modularize 

要 使 用 模块 化 工具 Modularize， 必 须 提供 用 于 相互 对 照 检查 的 头 文 件 列表 。 继 续 之 
前 游戏 项 目的 例子 ,我 们 编写 一 个 名 为 list.txt 的 文本 文件 ， 如 下 所 示 : 


gamelogic.h 
screenlogic.h 


然后 ， 我 们 使 用 该 文件 作为 参数 运行 Modularize: 


$ modularize list.txt 


如 果 修 改 其 中 一 个 头 文件 以 重复 定义 另 一 个 头 文件 中 的 符号 ，Modularize 将 产生 警告 
信息 ， 报 告 与 模块 系统 不 兼容 的 行为 ， 因 此 你 应 该 在 尝试 为 该 项 目 编写 module .modulemap 
文件 之 前 修复 头 文件 。 在 修复 头 文件 时 ， 请 记 住 每 个 头 文件 应 该 尽 可 能 独立 ， 并 且 不 能 根据 
其 他 被 导入 的 头 文件 中 定义 的 信息 来 改变 它 自 己 的 符号 定义 值 。 如 果 你 的 项 目 中 确实 存在 这 
种 依赖 关系 ， 你 应 该 把 该 头 文件 分 成 两 个 或 多 个 ， 分 别 对 应 于 编译 器 在 使 用 一 组 特定 的 宏 时 
所 看 到 的 符号 。 
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10.3.5 ”Module Map Checker (模块 映射 检查 器 ) 


Clang 工具 中 的 Module Map Checker 可 以 帮助 你 解析 module .modulemap 文件 ， 以 
确保 它 包 括 文件 夹 中 的 所 有 头 文件 。 你 可 以 在 上 一 节 的 例子 中 通过 下 面 的 命令 调用 它 : 


$ module-map-checker module.modulemap 


预 处 理 器 是 关于 使 用 include 指令 还 是 模块 的 讨论 中 的 关键 环节 。 在 下 一 节 中 ， 我们 
将 介绍 一 个 工具 ， 它 可 以 帮助 跟踪 这 个 特殊 前 端 组 件 的 活动 。 


10.3.6 PPTrace (追踪 工具 ) 


首先 请 看 下 面 从 Clang 文 档 (http://clang.llvm.org/doxygen/classclang 1 1 
Preprocessor .html) 中 摘录 的 有 关 clang: :preprocessor 的 一 句 话 : 

Engages in a tight little dance with the lexer to efficiently preprocess tokens. (与 词法 分 析 
器 进行 紧密 合作 以 有 效 地 预 处 理 令 牌 。) 

正如 第 4 章 中 所 指出 的 ，Clang 中 的 词法 分 类 器 是 其 分 析 源 文件 的 第 一 个 步骤， 它 负 责 
将 纯 文 本 分 组 成 供 解 析 器 使 用 的 信息 。lexer 类 没有 关于 语义 的 处 理 ， 因 为 这 是 解析 器 的 
责任 ,至 于 导入 的 头 文件 和 宏 扩 展 处 理 则 是 预 处 理 器 的 责任 。 

Clang 项 目 中 的 PPTtrace 工 具 可 以 输出 预 处 理 器 的 操作 序列 。 它 通过 实现 
clang::PPCallbacks 接口 的 回调 函数 来 完成 该 功能 。 它 首先 将 自己 注册 为 预 处 理 器 的 
观察 者 ， 然 后 启动 Clang 来 分 析 输 入 文件 。 对 于 每 个 预 处 理 器 的 操作 (例如 解释 #if 指令 、 
导入 模块 或 者 包括 头 文件 等 )， 该 工具 将 在 屏幕 上 打印 相应 信息 。 

考虑 以 下 C 语言 “hello world” 的 示例 : 

#if 0 


#include <stdio.h> 
#endif 


#ifdef CAPITALIZE 
#define WORLD "WORLD" 
#else 

#define WORLD "world" 
#endif 


extern int writel(int, const char*, unsigned long); 


int main() { 


write(1, "Hello, *, 7); 
write(1l, WORLD, 5); 
wridtetd,, "iM"; ZY 
return 0; 


} 
上 述 代码 的 第 一 行使 用 了 一 个 预 处 理 器 指令 #i£f， 并 且 它 的 计算 结果 总 为 false， 这 会 
强制 编译 器 忽略 直到 遇 到 下 一 个 #endif 指令 为 止 的 内 容 。 接 下 来 ,我 们 使 用 #ifdef 指 
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令 来 检查 是 否 已 经 定义 了 CAPITALIZE 宏 。 取 决 于 其 是 否 被 定义 ， 宏 WORLD 将 被 定义 为 
包含 “wor1ld” 的 大 写 或 小 写字 符 串 。 最 后 ， 示 例 代码 使 用 了 一 系列 的 write 系统 调用 在 
屏幕 上 输出 消息 。 

我 们 以 类 似 之 前 介绍 过 的 Clang 独立 工具 的 调用 方式 来 运行 pp-trace: 


$ pp-trace hello.c 


该 工具 的 运行 结果 是 一 系列 关于 安定 义 的 预 处 理 器 事件 ， 这 些 事件 甚至 在 源 文件 被 实际 
处 理 之 前 发 生 。 最 后 的 事件 与 我 们 的 具体 文件 有 关 ， 如 下 所 示 : 


- Callback: If 
Eee hello.esi2" 
ConditionRange: ["hello.c:1:4", "hello.c:2:1"] 
ConditionValue: CVK False 
- Callback: Endif 
Loc: "hello.c:3:2" 
IEEOo: “hello.cs1i2" 
- Callback: SourceRangeSkipped 
Range: ["hello.c:1:2", "hello.c:3:2"] 
- Callback: Ifdef 
Loc: "hello.e5:2" 
MacroNameTok: CAPITALIZE 
MacroDirective: (null) 
- Callback: Else 
LOcs "helloesTs2" 
IfLoe: "hello.6:52" 
Callback: SourceRangeSkipped 
Ranges:s I["hello.6s52", ”helloG7:2"] 
Callback: MacroDefined 
MacroNameTok: WORLD 
MacroDirective: MD Define 
Callback: Endif 
loc "helleo es:2" 
IfLOG: hello.e S52" 
Callback: MacroExpands 
MacroNameTok: WORLD 
MacroDirective: MD Define 
Range: ["hello.c:13:14", "hello.c:13:14"] 
Args: (null) 
Callback: EndOfMainFile 


第 一 个 事件 是 指 第 一 条 #if 预 处 理 器 指令 ， 其 对 应 的 代码 区 域 触发 了 3 个 回调 函 
数 : If、Endif 和 SourceRangeSkipped。 注 意 ， 它 里 面 的 #include 指令 没有 被 处 
理 ， 而 是 被 跳 过 了 。 同 样 ， 我们 可 以 观察 到 与 宏 定 义 WORLD 有 关 的 事件 : IfDef、Else、 
MacroDefined 和 EndIf。 最 后 ，pp-trace 通过 MacroExpands 事件 报告 我 们 使 用 了 
WORLD 宏 ， 然 后 到 达 文 件 末 尾 并 调用 EndofMainFile 回调 函数 。 

预 处 理 步 又 之 后 ， 前 端的 下 一 步骤 是 词法 分 析 和 语法 分 析 。 在 下 一 节 中 ， 我 们 将 介绍 一 
个 能 够 分 析 解 析 器 结果 ( 即 AST 节点 ) 的 工具 。 
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10.3.7 Clang Query (查询 工具 ) 


Clang Query 工具 在 LLVM 3.5 版 本 中 被 引入 ， 它 允许 读 取 源 文 件 并 交互 式 查询 其 关联 
的 AST (抽象 语 法 树 ) 节点 。 通 常 ， 它 是 检查 和 学 习 前 端 如 何 表示 每 段 代 码 的 好 工具 。 但 是 ， 
它 的 主要 目标 不 仅 是 用 于 检查 一 个 程序 的 抽象 语法 树 ， 而 且 还 可 以 测试 AST 匹配 器 。 

在 编写 重 构 工具 时 ， 可 能 需要 AST 匹配 器 的 帮助 ， 它 包含 多 个 可 以 与 你 感 兴趣 的 Clang 
AST 片段 进行 匹配 的 谓词 。Clang Query 用 于 为 这 部 分 的 开发 工作 提供 帮助 ， 它 允许 你 检查 
哪些 AST 节点 与 指定 的 AST 匹 配器 相 匹 配 。 你 可 以 检查 ASTMatchers .h Clang 头 文件 
以 查看 所 有 可 用 的 AST 匹配 器 ， 通 常 而 言 ， 匹 配器 的 名 称 是 将 表示 AST 节点 的 类 的 名 称 改 
为 骆驼 表示 法 。 例 如 ，functionDec1l 将 匹配 所 有 代表 函数 声明 的 FunctionDecl 节点 。 
在 测试 了 哪些 匹配 器 可 以 准确 地 返回 你 感 兴趣 的 节点 之 后 ， 可 以 在 重 构 工具 中 使 用 它们 来 自 
动 地 转换 节点 类 型 。 我 们 将 在 本 章 的 后 续 内 容 中 介绍 如 何 使 用 AST 匹配 器 库 。 

作为 检查 AST 的 一 个 示例 ， 我 们 将 对 之 前 介绍 PPTrace 时 使 用 的 “ hello world” 代 码 
运行 clang-query 工具 。 该 工具 需要 你 预先 准备 好 一 个 编译 命令 数据 库 。 如 果 你 处 理 的 
文件 缺少 该 数据 库 ， 则 可 以 通过 在 双 短 划 线 之 后 提供 编译 命令 ; 如 果 不 需 要 特殊 的 编译 器 标 
志 ， 请 将 其 置 空 ， 如 下 面 的 命令 行 所 示 : 


$ clang-query hello.c -- 


执行 这 个 命令 后 ，clang-query 会 显示 一 个 等 待 输入 命令 的 交互 提示 符 。 你 可 以 在 
匹配 命令 match 之 后 键入 任何 AST 匹配 器 的 名 称 。 例 如 在 以 下 命令 中 ， 我们 要 求 clang- 
query 显示 所 有 CallExpr 节点 : 


clang-query> match callExpr() 


Match #1: 
hello.c:12:5: note: "root" node binds here 
Write(l: EReLIG ™; 7):3 


A 


该 工具 将 突出 显示 与 CallExpr AST 节点 关联 的 第 一 个 记号 对 应 的 程序 代码 。Clang 
Query 所 支持 的 命令 列表 如 下 : 

e help: 打印 命令 列表 。 

e match <matcher name> 或 m <matcher name> : 通过 所 指定 的 匹配 器 遍历 
ASTs 

e Set output<(diag|print|dump)> : 此 命令 将 更 改 在 成 功 匹配 时 打印 节点 信 
息 的 方式 。 第 一 个 选项 为 默认 选项 ， 将 打印 一 条 突出 显示 该 节点 的 Clang 诊断 消息 。 
第 二 个 选项 将 打印 相应 的 源 代码 简单 摘要 ， 而 最 后 一 个 选项 将 调用 类 的 成 员 函 数 
dump ( ) ， 以 显示 所 有 子 节点 ， 用 于 复杂 的 调试 。 

这 里 我 们 建议 读者 通过 使 用 dump 选项 来 打印 高 层次 节点 的 信息 ， 以 了 解 源 程序 中 


Clang AST 的 组 织 结构 。 请 尝试 以 下 代码 : 


clang-query> set output dump 
clang-query> match functionDecl () 


它 将 向 你 展示 所 打开 的 C 源 代码 中 所 有 函数 体 相关 的 语句 和 表达 式 的 相关 类 的 实 
例 。 另 一 方面 ， 请 记 住 将 在 下 一 节 中 介绍 的 Clang Check 工具 更 容易 获得 完整 的 AST 信 
息 。Clang Query 更 适合 于 编写 AST 匹配 器 表达 式 以 获得 其 匹配 结果 。 稍 后 你 将 看 到 Clang 
Query 在 帮助 我 们 制作 第 一 个 代码 重 构 工 具 时 所 发 挥 的 重要 作用 ， 到 时 我 们 将 介绍 如 何 构建 
更 复杂 的 查询 语句 。 


10.3.8 Clang Check (检查 工具 ) 


Clang Check 是 一 个 非常 基础 的 工具 ， 它 只 有 不 到 几 百 行 的 代码 ， 因 此 学 习 它 很 容易 。 
另 一 方面 它 也 链接 LibTooling， 这 使 得 它 具 有 Clang 的 完整 解析 能 力 。 

Clang Check 可 以 用 于 解析 C/C++ 源 文 件 、 打 印 Clang AST 信息 或 执行 基本 检查 。 它 还 
可 以 应 用 Clang 建议 的 “修复 ”修改 ， 这 个 功能 利用 了 之 前 介绍 过 的 Clang Modernizer 中 的 
重 写 器 基础 架构 。 

假如 你 想 打 印 程序 program.c 的 AST 信息 ， 可 以 发 出 以 下 命令 : 


$ clang-check program.c -ast-dump -- 


注意 ，Clang Check 工具 遵循 LibTooling 库 处 理 源 文件 的 方式 ， 即 你 应 该 使 用 编译 命 人 
数据 库 文 件 或 在 双 短 划 线 (--) 之 后 提供 相应 的 参数 。 

由 于 Clang Check 是 一 个 小 工具 ， 因 此 可 以 把 它 当 作 编 写 自己 的 工具 时 一 个 很 好 的 参考 
示例 。 我 们 将 在 下 一 节 中 介绍 另 一 个 小 工具 ， 让 你 了 解 简单 的 代码 重 构 工 具 的 功能 。 


少 


10.3.9 ”remove-cstr-calls (调用 移 除 工具 ) 


remove-cstr-calls 工具 是 一 个 简单 的 源 代码 到 源 代码 转换 工具 ， 可 用 于 代码 重 构 。 它 
可 以 识别 对 std: :string 对 象 的 匈 余 c_str() 调用 ， 并 在 某 些 情况 下 可 以 重 写 代码 以 
消除 匈 余 调用 。 例 如 ,通过 某 个 字符 串 对 象 的 c_str( ) 的 结果 来 构建 一 个 新 的 字符 串 对 
象 ， 即 std: :string(myString.c_str())。 该 代码 可 以 简化 为 直接 使 用 字符 串 的 拷 
贝 构造 函数 ， 即 std: :string(mystring)。 男 外 一 个 例子 是 在 构建 LLVM 的 特定 类 
StringRef 和 Twine 的 实例 时 ， 最 好 使 用 字符 串 对 象 本 身 而 非 c_str( ) 的 结果 ， 即 使 用 
StringRef(myString) 而 非 StringRef (myString.c str())。 

整个 工具 可 以 在 一 个 单独 的 C++ 文件 中 实现 ， 这 使 得 它 成 为 一 个 优秀 示例 ， 可 以 帮助 
开发 人 员 学 习 如 何 使 用 LibTooling 库 编写 一 个 代码 重 构 工具 ， 这 也 是 我 们 下 一 节 的 内 容 。 


10.4 编写 自己 的 工具 
Clang 项 目 为 开发 者 提供 了 三 个 接口 ， 通 过 这 些 接口 ， 开 发 者 可 以 使 用 包括 解析 (句法 
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和 语义 分 析 等 ) 在 内 的 Clang 功能 。 第 一 个 接口 是 1ibclang， 它 是 Clang 的 主要 接口 ， 可 
提供 稳定 的 C 语言 API， 人 允许 外 部 项 目 与 其 链接 ， 并 在 高 层级 访问 整个 编译 框架 。 这 个 稳定 
的 接口 尽 可 能 地 保持 与 旧版 本 的 向 后 兼容 性 ， 避 免 了 新 版 本 的 Libclang 发 布 时 软件 的 适 
配 问题 。 通 过 使 用 诸如 Clang 的 Python 绑 定 等 方法 ， 开 发 者 也 可 使 用 其 他 语言 访问 该 接口 。 
例如 ，Apple Xcode 正 是 通过 1ibclang 与 Clang 进行 交互 。 

第 二 个 接口 是 Clang 插件 ， 它 允许 你 在 编译 期 间 添 加 自 定义 的 编译 流程 ， 而 不 是 像 
Clang 静态 分 析 器 等 工具 那样 执行 离线 分 析 。 这 对 于 实现 编译 每 个 翻译 单元 都 要 重复 的 操作 
是 非常 有 用 的 。 因 为 此 类 分 析 运 行 频 繁 ， 你 需要 注意 它 的 执行 时 间 。 男 一 方面 ， 将 你 的 分 析 
集成 到 构建 系统 中 如 同 向 编译 器 传递 标志 一 样 容易 。 

Clang 的 第 三 个 接口 是 其 LibTooling 库 ， 之 前 已 经 简略 介绍 过 其 强大 的 功能 ， 它 允许 你 
轻松 构建 独立 工具 ， 比 如 本 章 中 介绍 的 用 于 代码 重 构 或 语法 检查 的 工具 。 与 Libclang 相 
比 ，LibTooling 牺牲 了 一 定 的 向 后 兼容 性 ， 但 是 它 允 许 你 访问 完整 的 AST 结构 。 


10.4.1 问题 定义 : 编写 一 个 C++ 代码 重 构 工 具 


本 章 的 剩余 部 分 将 介绍 一 个 编写 C++ 代码 重 构 工 具 的 详细 示例 。 假 设 你 创立 了 一 个 虚 
构 的 初创 公司 来 推广 一 个 新 的 名 为 lzzyC++ 的 C++ 集成 开发 环境 IDE。 该 公司 的 商业 计划 
是 吸引 那些 厌倦 了 现 有 IDE 无 法 自动 重 构 代 码 的 用 户 。 你 将 使 用 LibTooling 来 制作 一 个 简 
单 但 有 效 的 代码 重 构 工具 ， 它 的 输入 为 一 个 C++ 成员 函数 、 其 完全 限定 名 称 和 替换 名 称 。 
它 的 任务 是 找到 这 个 成 员 函 数 的 定义 ， 将 其 改 为 使 用 替换 名 称 ， 并 相应 地 更 改 其 所 有 函数 
调用 。 


10.4.2 配置 源 代 码 位 置 


首先 你 要 确定 项 目 代 码 的 存放 位 置 。 在 LLVM 源 文件 夹 中 ， 我 们 将 在 tools/clang/ 
tools/extra 内 创建 一 个 名 为 itzzyrefactor 的 新 文件 夹 ， 以 保存 该 项 目的 所 有 文件 。 
接 下 来 ， 需 要 扩展 extra 文件 夹 中 的 Makefile 以 包含 该 项 目 。 你 可 以 查找 DIRS 变量 ， 并 
将 名 称 izzyrefactor 添加 到 其 他 Clang 工具 项 目 对 应 的 位 置 。 如 果 使 用 CMake， 还 需要 
在 CMakeLists .txt 文件 中 添加 如 下 行 : 


add subdirectory (izzyrefactor) 


接 下 来 ， 转 到 izzyrefactor 文件 来， 并 创建 一 个 新 的 Makefile 以 告知 LLVM 构建 
系统 : 正在 构建 独立 于 其 他 二 进 制 文件 的 工具 。 使 用 以 下 代码 : 


CLANG LEVEL := ../../.-. 

TOOLNAME = izzyrefactor 

TOOL NO EXPORTS = 1 

include $ (CLANG LEVEL)/../../Makefile.config 

LINK COMPONENTS := $(TARGETS TO BUILD) asmparser bitreader support\ 

mc option 

USEDLIBS = clangTooling.a clangFrontend.a clangSerialization.a \ 

clangDriver.a clangRewriteFrontend.a clangRewriteCore.a \ 


clangParse.a clangSema.a clangAnalysis.a clangASsT.a \ 
clangASTMatchers.a clangEdit.a clangLex.a clangBasic.a 
include $ (CLANG LEVEL) /Makefile 


上 述 文件 声明 了 你 的 代码 需要 链接 的 所 有 软件 库 ， 这 对 于 顺利 构建 你 的 项 目 是 非常 重 
要 的 。 如 果 你 不 需要 在 运行 make install 时 让 新 工具 与 其 他 LLVM 工具 一 起 安装 ， 则 
可 以 选择 性 地 将 NO_INSTALL=1 这 行 代码 添加 到 具有 TOOL_NO_EXPORTS 字段 的 代码 行 
雹 后 5 

由 于 该 示例 工具 不 使 用 任何 插件 ， 即 它 不 会 导出 任何 符号 ， 因 此 我 们 使 用 TooL_ 
NO_EXPORTS=1， 这 样 可 以 减少 最 终 二 进 制 文件 中 动态 符号 表 的 大 小 ， 同 时 还 可 以 缩短 
动态 链接 和 加 载 程 序 所 需 的 时 间 。 注 意 ， 在 上 述 代码 的 最 后 部 分 我们 导入 了 Clang 的 主 
Makefile， 因 为 它 定 义 编译 项 目的 所 有 必要 规则 。 

如 果 你 使 用 CMake 而 不 是 自动 工具 配置 脚本 ， 请 创建 一 个 新 的 CMakeLists .txt 文 
件 并 包含 以 下 内 容 : 


add clang executable (izzyrefactor 
IzzyRefactor.cpp 
) 
target link libraries (izzyrefactor 
clangEdit clangTooling clangBasic clangAST clangASTMatchers) 


另外 ， 如 果 不 想 在 Clang 源 代码 树 中 构建 此 工具 ， 也 可 以 将 其 构建 为 独立 工具 。 只 要 使 
用 在 第 4 章 未 尾 为 驱动 程序 工具 提供 的 相同 Makefile， 并 稍 作 修改 即 可 。 请 留意 我 们 在 此 
示例 的 Makefile 中 通过 USEDLIBS 变量 使 用 的 库 ， 以 及 在 第 4 章 末 尾 的 Makefile 中 通过 
CLANGLIBS 变量 使 用 的 库 。 除 了 USEDLIBS 变量 中 的 clangTooling (对 应 LibTooling 
库 ) 之 外 ， 这 两 个 变量 所 对 应 的 库 是 相同 的 。 因 此 ， 在 第 4 章 的 Makefile 中 ， 在 包 
含 -lclang\ 的 行 之 后 添加 -lclangTooling\ 行 ， 即 可 将 其 用 于 我 们 编写 的 工具 。 


10.4.3 齐 析 工具 的 模板 代码 


你 的 所 有 代码 都 将 在 IzzyRefactor.cpPp 文件 中 。 请 创建 此 文件 ， 并 向 其 中 添加 如 
下 初始 模板 代码 : 


int main(int argc, char **argv) { 
cl::ParseCommandLineOptions (argc, argv); 
string ErrorMessage; 
OwningPtr<CompilationDatabase> Compilations (人 
CompilationDatabase::loadFromDirectory!( 
BuildPath, ErrorMessage)); 
if (!Compilations) 
report fatal error (ErrorMessage); 
js 
} 


你 的 主 函 数 首先 是 来 自 llvmi::cl 命名 空间 的 ParseCommandLineOptions 函数 ， 该 阴 数 自 
动 解析 argv 中 的 每 个 标志 。 
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< 、 基 于 LibTooling 的 代码 重 构 工 具 通 常 使 用 CommonOptionsParser 对 象 来 简化 
常用 的 选项 解析 功能 (请 参阅 http: //clang.llvm.org/doxygen/clas 
sclang 1 ltooling 1 lCommonOptionsParser.html 中 的 代码 示例 )。 
而 我 们 的 例子 使 用 更 底层 的 ParseCommandLineOptions() 函数 以 便 更 详细 
地 说 明 参 数 解析 过 程 ， 这 有 助 于 编写 其 他 非 基于 LibTooling 的 工具 。 但 是 ， 仍 
然 可 以 使 用 CommonOptionsParser 来 简化 代码 (这 可 以 作为 一 个 很 好 的 动手 
练习 )。 


几乎 所 有 LLVM 工具 都 使 用 cl 命名 空间 (http://llvm.org/docs/doxygen/html/ 
namespacellvm_1_1cl.html) 提供 的 实用 程序 ， 通 过 这 些 实用 程序 ， 可 以 方便 地 定义 
我 们 的 工具 应 该 识别 命令 行 中 的 哪些 参数 。 为 此 ， 我 们 声明 模板 类 型 为 opt 和 List 的 新 
全 局 变量 : 
cl::opt<string> BuildPath!( 
cl::Positional, 
cl::desc("<build-path>")); 
cl::list<string> SourcePaths ( 
cl::Positional, 
cl::desc("<source0> [... <SourceN>]")， 
cl::OneOrMore); 
cl::opt<string> OriginalMethodName ("method", 
cl::desc("Method name to replace"), 
cl::ValueRequired); 
cl::opt<string> ClassName ("class", 
cl::desc('"Name of the class that has this method"), 
cl::ValueRequired); 
cl::opt<string> NewMethodName ("newname", 
cl::desc("New method name"), 
cl::ValueRequired); 


请 在 主 函 数 的 定义 之 前 声明 这 5 个 全 局 变量 ， 并 按照 我 们 希望 作为 参数 读 取 的 数据 种 类 
来 特 化 类 型 opt。 例 如 ， 如 果 需 要 读 取 一 个 数字 ， 则 可 以 声明 一 个 cl: :opt<int> 类 型 的 
全 局 变量 。 

要 读 取 这 些 参数 的 值 ， 首 先 需要 调用 ParseCcommandLineoptions。 之 后 ， 便 可 以 
通过 该 全 局 变量 的 名 称 获取 其 对 应 的 值 。 例 如 在 std: :out << NewMethodName 的 例子 
中 ，NewMethodName 的 评估 值 和 用 户 参 数 中 提供 的 字符 串 的 值 是 等 价 的 。 

上 述 方法 可 行 的 原因 在 于 ，opt_storage<> 模板 作为 opt <> 模板 的 超 类 ,继承 了 它 
所 管理 的 数据 类 型 ( 即 本 例 中 的 字符 串 )。 通 过 继承 ，opt <string> 变量 也 可 以 当 作 字 符 
串 使 用 。 如 果 opt<> 模板 类 不 能 从 所 管理 的 数据 类 型 继承 (例如 没有 int 类 )， 它 将 定义 一 
个 转换 运算 符 (例如 ， 为 int 类 型 定义 operator int())。 这 两 种 代码 实现 有 着 相同 的 
效果 ， 当 引用 一 个 cl1: :opt<int> 变量 时 ， 它 可 以 自动 转换 为 整数 并 返回 其 保存 的 值 ， 与 
用 户 在 命令 行 中 提供 的 值 一 样 。 

我 们 也 可 以 为 参数 指定 不 同 的 特征 。 我 们 通过 c1: :Positional 指定 位 置 参数 ， 这 意 
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味 着 用 户 会 根据 该 参数 在 命令 行 中 的 相对 位 置 来 指定 它 ， 而 不 是 通过 其 名 称 。 我 们 还 将 一 个 
desc 对 象 传递 给 opt 类 的 构造 函数 ， 该 函数 定义 了 在 用 户 使 用 -help 参数 时 所 打印 的 帮 
助 信息 。 

另外 一 个 参数 为 cl1: :1ist 类 型 ， 它 与 opt 不 同 之 处 在 于 允许 传递 多 个 参数 ， 即 示例 
中 需要 处 理 的 源 文件 列表 。 要 使 用 上 述 功能 需要 导入 以 下 头 文件 : 


#include "llvm/Support/CommandLine.h" 


< 、 在 标准 LLVM 风格 的 代码 中 ，include 语句 的 导入 顺序 依次 为 本 地 头 文件 、 
ns 头 文 件 和 LLVM API 头 文件 。 当 两 个 头 文件 属于 同一 类 别 时 ， 按 字母 顺序 
排列 。 你 可 以 尝试 编写 一 个 对 导入 的 头 文件 自动 排序 的 独立 工具 。 


最 后 三 个 全 局 变量 允许 必需 的 选项 使 用 我 们 的 重 构 工 具 。 首 先是 一 个 名 称 为 -method 
的 参数 。 第 一 个 字符 串 参数 声明 了 不 带 短 划 线 的 参数 名 称 ， 而 cl: :RequiredValues 和 癌 
命令 行 解析 器 表明 这 个 值 是 运行 这 个 程序 所 必需 的 。 该 参数 为 我 们 的 工具 提供 需要 查找 的 函 
数 名 称 ， 然 后 将 其 替换 为 -newname 参数 中 提供 的 名 称 。-class 参数 提供 具有 此 方法 的 
类 的 名 称 。 

下 一 段 模板 代码 片段 负责 管理 一 个 新 的 CompilationDatabase 对象。 首先， 我 们 需 
要 包括 用 于 定义 owningPtr 类 的 头 文件 ， 该 类 是 LLVM 库 中 使 用 的 智能 指针 ， 即 当 它 包 
含 的 指针 到 达 其 作用 域 的 末尾 时 会 自动 解除 分 配 ( 即 析 构 )。 


#include "llvm/ADT/Owningptr.h" 


Kg Clang 的 版 本 提示 : Clang/LLYM 从 3.5 版 本 开始 推荐 使 用 std: :unique_ 
ptr<> 这 一 标准 C++ 模板 类 ， 并 废弃 使 用 OwningPtr<> 模板 类 。 


其 次 ， 我 们 需要 导入 CompilationDatabase 类 的 头 文件 ， 这 也 是 我 们 之 前 所 接触 的 
第 一 个 LibTooling 相关 头 文件 : 


#include "clang/Tooling/CompilationDatabase.h" 


该 类 负责 管理 编译 命令 数据 库 ， 关 于 其 配置 已 经 在 本 章 的 开始 部 分 进行 了 解释 。 这 个 数 
据 库 包含 在 处 理 用 户 希 望 分 析 的 每 个 源 文件 时 所 需 的 编译 命令 。 为 了 初始 化 该 对 象 ， 我 们 使 
用 一 个 名 为 loadFromDirectory 的 工厂 函数 ， 它 将 从 指定 的 构建 目录 加 载 编译 命令 的 数 
据 库 文件 。 为 此 ， 我 们 将 构建 路 径 设计 成 工具 的 一 个 参数 : 用 户 需要 指定 其 源 代 码 和 编译 命 
令 数 据 库 文 件 所 在 的 位 置 。 

请 注意 ， 我 们 将 两 个 参数 传递 给 此 工厂 成 员 函 数 BuildPath : 代表 命令 行 对 象 的 
cl: :opt 对 象 以 及 刚 声明 的 ErrorMessage 字符 串 。 如 果 引 擎 无 法 加 载 编 译 命 令 数 据 
库 ，ErrorMessage 字符 串 将 被 填充 相应 的 错误 消息 。 这 种 情况 下 ， 该 函数 不 会 返回 任何 
CompilationDatabase 对 象 并 且 立 即 打印 该 错误 消息 。llvm: :report_fatal_ 
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error( ) 函数 将 触发 任何 已 安装 的 LLVM 错误 处 理 例 程 ， 并 以 错误 代码 为 1 退出 我 们 的 工 
具 。 它 需要 包含 以 下 头 文件 : 


#include "llvm/Support/ErrorHandling.h" 


在 我 们 的 例子 中 ， 由 于 我 们 缩写 许多 类 的 完全 限定 名 称 ， 因 此 需要 在 全 局 范围 内 添加 如 
下 using 声明 (如 果 使 用 完全 限定 名 称 则 可 以 省 去 这 些 声明 ): 


using namespace clang; 

using namespace std; 

using namespace llvm; 

using clang::tooling::RefactoringTool; 

using clang::tooling::Replacement; 

using clang::tooling::CompilationDatabase; 
using clang::tooling: :newFrontendActionFactory; 


10.4.4 使 用 AST 匹配 器 


AST 匹配 器 已 经 在 本 章 前 面 简要 介绍 过 ， 但 我 们 会 在 这 里 详细 地 分 析 它们 ， 因 为 它们 
对 编写 基于 Clang 的 代码 重 构 工具 非常 重要 。 

AST 匹配 器 库 允 许 其 用 户 容 易 地 匹配 符合 特定 谓词 的 Clang AST 的 子 树 ， 例 如 ， 以 两 
个 参数 来 调用 名 称 为 calloc 的 函数 的 所 有 AST 节点 。 查 找 特 定 的 Clang AST 节点 并 修改 
它们 是 几乎 所 有 代码 重 构 工 具 共 有 的 基本 任务 ， 而 使 用 这 个 库 可 以 极 大 地 简化 编写 这 些 工 具 
的 任务 。 

为 了 帮助 找到 适合 我 们 案例 的 匹配 器 ， 我 们 将 依靠 Clang Query 以 及 位 于 http//clang. 
llvm.org/docs/LibASTMatchersReference.html 的 AST 匹配 器 文档 。 

我 们 将 首先 为 你 的 工具 编写 名 为 wildlifesim.cpp 的 测试 用 例 。 这 是 一 个 复杂 的 一 
维 动物 生活 模拟 器 : 该 动物 只 能 沿 直线 在 任意 方向 上 行走 : 


class Animal { 
int position; 
public: 
Animal (int pos) : position(pos) {} 
// Return new position 
int walk (int quantity) { 
return position += quantity; 
} 
} 
class Cat : public Animal { 
public: 
Cat (int pos) : Animal (pos) {} 
void meow() {} 
void destroysofa() {} 
bool wildMood() {return true;} 
地 
int main() { 
Cat CSO 
c.meow(); 
if (c.wildMood()) 
c.destroySofa(); 
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C.walk(2) ; 
return 0; 
} 

我 们 希望 你 的 工具 能 够 (例如) 将 成 员 函 数 run 重新 命名 为 walk。 首 先 让 我 们 使 用 
Clang Query 查看 这 个 案例 中 AST 结构。 我 们 将 使 用 recordDecl 匹配 器 并 打印 所 有 
RecordDecl AST 节点 的 内 容 ， 这 些 节 点 负责 表示 C 结构 体 和 C++ 类: 

$ clang-query wildanimal-sim.cpp -- 

clang-query> set output dump 

clang-query> match recordDecl () 

(sud 
| -CXXMethodpecl 0x(...) <line:6:3, line 8:3> line 6:7 walk 'int (int)， 
《sa 

在 表示 Animal 类 的 RecordDec1 对 象 内 部 ， 我 们 观察 到 walk 被 表示 为 一 个 
CXXMethodDecl AST 节点 。 通 过 查看 AST 匹 配器 文档 ， 我 们 发 现 它 与 methodDec1 
AST 匹配 需 匹 配 。 

10.4.4.1 匹配 器 组 合 

AST 匹 配器 的 强大 之 处 在 于 其 组 合 性 。 例 如 ， 如 果 只 想 匹 配 声明 walk 成 员 函 数 的 
MethodDec1 节点 ， 可 以 先 匹 配 所 有 名 为 walk 的 声明 ， 然 后 再 进行 细 化 以 便 仅 匹配 其 中 
也 是 方法 声明 的 部 分 。 匹 配器 hasName ("input") 返回 名 称 为 "input" 的 所 有 命名 声 
明 。 你 可 以 在 Clang Query 中 测试 methodDecl 和 hasName 的 组 合 : 


clang-query> match methodDecl (hasName ("walk")) 


你 将 会 看 到 ， 上 述 代码 的 运行 结果 并 没有 返回 存在 于 代码 中 的 8 种 不 同 的 方法 声明 ， 而 
只 是 返回 对 应 walk 函数 的 声明 。 

但 请 注意 ， 仅 在 Animal 类 中 更 改 walk 函数 的 定义 是 不 够 的 ， 因 为 派生 类 可 能 会 重 写 
它 。 我 们 不 希望 我 们 的 重 构 工具 重 写 超 类 中 的 方法 ， 而 是 希望 在 派生 类 中 保持 其 他 重 载 方法 
不 变 。 

因此 我 们 需要 找到 所 有 名 为 Animal 的 类 或 从 它 派生 的 类 ， 以 及 定义 了 walk 也 数 的 
类 。 要 找到 所 有 具有 名 称 Animal 或 从 它 派生 的 类 ， 我 们 使 用 匹配 器 issameOrDerived 
From( ) ， 它 的 参数 类 型 为 NamedDec1。 该 参数 将 由 一 个 匹配 器 的 组 合 提供 : 具有 特定 名 
称 hasName() 的 所 有 NamedDec1 节点 。 因 此 ， 我 们 的 查询 将 如 下 所 示 : 

clang-query> match recordDecl (isSameorDerivedFrom(hasName ("Rnimaln) ) ) 

我 们 还 需要 匹配 重 载 了 walk 函数 的 派生 类 。hasMethod( ) 谓词 可 以 用 于 返回 包含 特 
定 方法 的 类 声明 。 我 们 在 第 一 个 查询 的 基础 上 使 用 它 ， 形 成 以 下 查询 : 


clang-query> match recordDecl (hasMethod (methodDec1l (hasName ("walk")))) 


为 了 以 and 操作 符 的 语义 连接 两 个 谓词 (所 有 的 谓词 必须 是 有 效 的 )， 我 们 使 用 
all0f() 匹配 器 。 它 要 求 所 有 作为 其 操作 数 传 递 的 匹配 器 必须 是 有 效 的 。 下 述 代码 是 查找 
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我 们 将 要 重 写 的 所 有 声明 的 最 终 查询 语句 : 


clang-query> match recordDecl (allOf (hasMethod (methodDec1l (hasName ("wa 
lk"))), isSameOrDerivedFrom(hasName ("Animal")))) 


通过 这 个 查询 语句 ， 我 们 可 以 精确 地 定位 所 有 名 为 Animal 或 从 它 派生 的 类 的 walk 方 
法 声明 。 

现在 我 们 可 以 替换 所 有 声明 所 使 用 的 名 称 ， 但 是 ， 仍 然 需 要 改变 方法 调用 。 为 此 ， 我 
们 将 借助 于 CXXMemberCal1Expr 节点 及 其 匹配 器 memberCal1Expr。 请 尝试 运行 以 下 
查询 : 


clang-query> match memberCallExpr() 


Clang Query 返回 4 个 匹配 结果 ， 对 应 代码 中 的 4 个 方法 调用 : meow、wildMood、 
destroySofa 和 walk。 我 们 只 想 定 位 最 后 一 个 。 我 们 已 经 知道 如 何 使 用 hasName() 
匹配 器 来 选择 特定 的 声明 ， 但 是 如 何 将 函数 的 声明 映射 到 成 员 调 用 表达 式 呢 ? 答案 是 使 用 
member ( ) 匹配 器 先 选 择 与 方法 名 称 链接 的 已 命名 声明 ， 然 后 使 用 callee( ) 匹配 器 将 其 
与 调用 表达 式 进行 关联 。 完 整 的 查询 语句 如 下 : 


clang-query> match memberCallExpr (callee (memberExpr (member (hasName ("wa 
lk"))))) 


但 上 述 查 询 语句 将 盲目 地 选择 所 有 walk( ) 函数 的 调用 ， 而 我 们 只 想 选 择 属于 Animal 
类 或 其 派生 类 的 walk( ) 调用 。 为 此 ， 我 们 使 用 membercallExpr( ) 匹配 器 的 第 二 个 参 
数 。 我 们 将 使 用 thisPointerType() 匹配 器 来 只 选择 其 被 调用 对 象 是 特定 类 的 方法 调 
用 。 下 面 的 代码 给 出 基于 这 个 原则 的 完整 表达 式 : 

clang-query> match memberCallExpr (callee (memberExpr (member (hasName ("wa 


lk")))), thisPointerType (recordDecl (isSameOrDerivedFrom (hasName ("Anim 
al") )})) 


10.4.4.2 将 AST 匹配 器 谓词 用 于 代码 中 
在 决定 使 用 哪些 谓词 来 正确 捕获 感 兴趣 的 AST 节点 之 后 ,我们 接 下 来 需要 把 它 运 用 在 
我 们 的 工具 代码 中 。 首 先 ， 要 使 用 AST 匹配 器 ， 我 们 需要 添加 新 的 include 指令 : 


#include "clang/ASTMatchers/ASTMatchers.h" 
#include "clang/ASTMatchers/ASTMatchFinder.h" 


我 们 还 需要 添加 一 个 新 的 using 指令 ， 以 便 更 容易 引用 这 些 类 ( 放 在 其 他 using 指 
令 后 ): 
using namespace clang::ast matchers; 


第 二 个 头 文件 是 工具 中 使 用 的 查找 器 机 制 所 必需 的 ， 我 们 将 在 稍 后 介绍 。 我 们 继续 在 工 
具 的 主 函 数 中 添加 剩 下 的 代码 : 
RefactoringTool Tool (*Compilations，SourcePaths) ; 


ast matchers::MatchFinder Finder; 
ChangeMemberDecl DeclCallback (&Tool .getReplacements ()); 
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ChangeMemberCall CallCallback (&Tool .getReplacements ()); 
Finder.addMatcher( 
recordDecl ( 
allof (hasMethod (id ("methodDecl", 
methodDec] (hasName (OriginalMethodName)))), 
isSameOrDerivedFrom (hasName (ClassName) ) ) ) ， 
&DeclCallback); 
Finder .addMatcher ( 
memberCallExpr ( 
callee (id('"member", 
memberExpr (member (hasName (OriginalMethodName))))), 
thisPointerType (recordDecl ( 
isSameOrDerivedFrom(hasName (ClassName))))), 
&CallCallback); 
return Tool.runAndSave (newFrontendActionFactory (&Finder));)); 


KA Clang 版 本 提示 : 在 版 本 3.5 中 ， 你 需要 更 改 上 述 代 码 的 最 后 一 行为 : return 


Tool .runandSave(newFrontendRct ionFactory(&Finder).get());。 


这 样 就 完成 了 主 函 数 main 的 代码 ， 我 们 稍 后 将 介绍 回调 函数 的 代码 。 这 段 代 码 的 第 一 
行 实例 化 一 个 新 的 RefactoringTool 对 象 ， 这 是 我 们 使 用 的 LibTooling 库 的 第 二 个 类 ， 
它 需 要 一 个 额外 的 include 语句 : 


#include "clang/Tooling/Refactoring.h" 


RefactoringTool 类 实现 了 用 来 协调 工具 的 不 同 基 本 任务 的 所 有 逻辑 ， 比 如 打开 源 
文件 、 解 析 它 们 、 运 行 AST 匹配 器 、 匹 配 时 调用 回调 函数 ， 以 及 应 用 你 的 工具 给 出 的 源 代 
码 修改 建议 。 这 也 解释 了 为 什么 在 初始 化 所 有 必要 的 对 象 后 需要 通过 调用 Refactoring 
Tool: :runRandSave( ) 来 结束 主 函数 ， 这 是 为 了 把 控制 权 交 给 这 个 类 ， 让 它 完成 所 有 这 
些 任务 。 

接 下 来 ,我们 声明 已 导入 的 头 文件 中 包含 的 MatchFinder 对 象 ， 这 个 类 负责 
在 Clang AST 中 执行 匹配 操作 ， 这 个 功能 已 经 在 之 前 介绍 的 Clang Query 中 使 用 过 。 我 
们 需要 为 MatchFinder 配置 AST 匹 配 咽 和 回调 函数 ， 该 函数 在 AST 节 点 与 提供 的 
AST 匹配 器 匹配 时 调用 。 你 可 以 在 此 回调 函数 中 进行 源 代码 的 修改 。 此 回调 函数 是 作为 
MatchCallback 的 一 个 子 类 实现 的 ， 我 们 将 在 后 面 讨论 更 多 细节 。 

然后 ， 我 们 声明 回调 对 象 ， 并 使 用 MatchFinder::addFinder() 方 法 将 特定 的 
AST 匹配 器 与 相应 的 回调 函数 进行 关联 。 我 们 需要 分 别 声明 两 个 回调 函数 ， 一 个 用 于 重 写 
方法 声明 ， 另 一 个 用 于 重 写 方法 调用 。 我 们 将 这 两 个 回调 函数 命名 为 Declcallback 和 
callcallback。 我 们 使 用 前 面 章 节 中 设计 的 两 个 AST 匹配 器 组 合 ， 但 将 类 名 Animal 替 
换 为 ClassName， 它 是 用 户 通过 命令 行 参数 提供 的 需要 进行 代码 重 构 的 类 名 。 另 外 ,我们 
使 用 originalMethodName (也 是 命令 行 参数 ) 替换 函数 名 walk。 

我 们 还 策略 性 地 引入 一 个 名 为 id() 的 新 匹配 器 ， 它 不 修改 匹配 的 节点 ， 只 是 将 某 个 名 
称 与 具体 的 节点 绑 定 。 这 对 于 回调 函数 执行 替换 操作 非常 重要 。id() 匹配 器 有 两 个 参数 ， 
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第 一 个 是 将 用 来 检索 节点 的 名 称 ， 第 二 个 是 捕获 该 节点 的 匹配 器 。 

在 负责 定位 成 员 函 数 声 明 的 第 一 个 AST 组合 中 ， 我 们 命名 了 标识 该 方法 的 Method 
Decl 节点 。 在 负责 定位 成 员 函 数 调用 的 第 二 个 AST 组 合 中 ,我 们 命名 了 与 被 调用 成 员 函 数 
链接 的 CXXMemberExpr 节点 。 


10.4.5 ”编写 回调 函数 


你 需要 定义 在 AST 节点 匹配 成 功 时 要 执行 的 操作 ， 我 们 通过 创建 两 个 派生 自 Match 
Callback 的 新 类 来 执行 此 操作 ， 对 应 之 前 的 两 个 匹配 器 组 合 。 


class ChangeMemberDecl] : public 
ast matchers::MatchFinder::MatchCallback{ 
tooling::Replacements *Replace; 
public: 
ChangeMemberDecl (tooling: :Replacements *Replace) 
Replace (Replace) {} 
Virtual void run(const ast matchers::MatchFinder::MatchResult 
&Result) { 
const CXXMethodDecl *method = 
Result .Nodes .getNodeAs<CXXMethodDecl> ("methodDec]l1"); 
Replace->insert (Replacement ( 
*Result .SourceManager, 
CharSourceRange: :getTokenRange ( 
SourceRange (method->getLocation())), NewMethodName)); 
} 
到 


class ChangeMemberCall : public 
ast _ matchers::MatchFinder: :MatchCallback{ 
tooling: :Replacements *Replace; 
public: 
ChangeMemberCall (tooling::Replacements *Replace) 
Replace (Replace) {} 
virtual void Fun (const ast matchers: :MatchFinder::MatchResult 
&Result) { 
const MemberExpr *member = 
Result .Nodes .getNodeAs<MemberExpr> ("member"),; 
Replace->insert (Replacement ( 
*Result .SourceManager, 
CharSourceRange: :getTokenRange ( 
SourceRange (member->getMemberLoc () ) ) NewMethodName)); 
} 
3 


这 两 个 类 都 各 自私 有 地 存储 Replacements 对 象 (使 用 typedef 定义 的 std: :set 
<Replacement> 的 别名 ) 的 引用 。Replacements 类 存储 有 关 在 哪些 文件 的 哪些 行 中 哪 
些 文本 需要 修补 的 信息 ， 它 的 序列 化 已 在 对 Clang Apply Replacement 工具 的 介绍 中 进行 过 
讨论 。RefactoringTool 类 在 内 部 管理 Replacement 对 象 的 集合 ， 这 也 是 我 们 使 用 
RefactoringTool: :getReplacements() 男 数 获取 这 个 集合 并 在 主 函 数 中 用 它 初始 化 
回调 函数 的 原因 。 


我 们 定义 一 个 参数 为 Replacements 对 象 指 针 的 基本 构造 消 数 ， 并 存储 这 个 对 象 指针 
以 备 后 用 。 我 们 将 通过 重 写 run( ) 函数 来 实现 回调 函数 的 操作 ， 它 的 代码 非常 简单 。 我 们 
的 函数 需要 一 个 MatchResult 对 象 作为 参数 。 对 于 给 定 的 匹配 ，MatchResult 类 存储 
由 id() 匹配 器 所 请 求 的 名 称 所 绑 定 的 所 有 节点 。 

这 些 节 点 在 BoundNodes 类 中 进行 管理 ， 并 通过 公开 成 员 名 Nodes 存储 于 MatchResult 
类 中 。 因 此 我 们 在 run() 函数 中 的 第 一 个 操作 是 通过 调用 专门 的 方法 BoundNodes : : 
getNodeAs<CXXMethodDec1> 来 获得 我 们 感 兴 趣 的 节点 ， 这 样 ， 就 获得 对 CXXMethod 
Decl AST 节点 的 只 读 引 用 。 

在 找到 此 节点 之 后 ， 为 了 确定 如 何 修补 代码 ， 需 要 一 个 SourceLocation 对 象 ， 该 对 
象 告诉 我 们 关联 的 记号 在 源 文件 中 占据 的 确切 行 和 列 。CXXMethodpec1l 从 代表 声明 的 通用 
超 类 Dec1l 继承 。 通 用 类 型 Dec1 提供 的 Decl::getLocation() 方法 可 以 用 于 返回 我 们 
想 要 的 SourceLocation 对 象 。 有 了 这 些 信息 ， 就 可 以 创建 我 们 的 第 一 个 Replacement 
对 象 ， 并 将 其 插入 我 们 的 工具 所 建议 的 源 代码 更 改 列表 中 。 

我 们 使 用 的 Replacement 构造 函数 需要 三 个 参数 : SourceManager 对 象 的 引 
用 、charSourceRange 对 象 的 引用 以 及 向 前 两 个 参数 指向 的 位 置 写 入 的 替换 字符 
串 。SourceManager 类 是 一 个 通用 的 Clang 组 件 ， 用 于 管理 加 载 到 内 存 中 的 源 代 码 。 
CharSourceRange 类 中 包含 的 代码 可 用 于 分 析 令 牌 并 产生 包含 此 令 牌 的 源 代码 范围 (由 源 
文件 中 的 两 个 点 决定 )， 从 而 确定 需要 从 源 代 码 文件 中 删除 并 替换 为 新 文本 的 确切 代码 字符 。 

有 了 这 些 信息 ， 就 可 以 创建 一 个 新 的 Replacement 对 象 ， 并 将 其 存储 在 Refactoring 
Tool 管理 的 集合 中 ， 这 样 ， 我 们 就 完成 了 所 有 编码 工作 。RefactoringTool 将 负责 实际 
应 用 这 些 补 丁 或 删除 冲突 的 补丁 。 不 要 忘记 将 所 有 局 部 声明 包含 在 匿名 命名 空间 中 ， 避 免 该 
翻译 单元 导出 局 部 符号 是 一 个 好 的 编程 习惯 。 


10.4.6 ”测试 编写 的 重 构 工 具 


我 们 将 使 用 之 前 的 野生 动物 模拟 器 代码 示例 作为 新 创建 的 工具 的 测试 用 例 。 现 在 应 该 运 
行 make 并 等 待 LLVM 完成 你 的 新 工具 的 编译 和 链接 。 完 成 之 后 就 可 以 开始 使 用 这 个 工具 
了 。 首 先 检 查 声 明 为 cl : :opt 对 象 的 参数 是 否 出 现在 命令 行 界面 中 : 


$ izzyrefactor -help 


要 使 用 这 个 工具 ， 我 们 仍然 需要 一 个 编译 命令 数据 库 。 为 了 避免 创建 CMake 配置 文件 
和 运行 它 ， 我 们 将 手动 创建 一 个 编译 命令 数据 库 ， 请 将 它 命名 为 compile_commands. 
json 并 键入 以 下 代码 ， 并 将 标签 <FULLPATHTOFILE> 替换 为 你 放置 野生 动物 模拟 器 源 代 
码 的 文件 夹 的 完整 路 径 : 


[ 
{ 

"directory" : "<FULLPATHTOFILE>", 

"command": "/usr/bin/c++ -oO wildlifesim.cpp.o -C <FULLPATHTOFILE>/ 
wildlifesim.cpp", 
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"file": "<FULLPATHTOFILE>/wildlifesim.cpp" 
} 
] 


在 保存 编译 命令 数据 库 之 后 ， 即 可 测试 该 工具 : 
$ izzyrefactor -class=Animal -method=walk -newname=run ./ wildlifesim.cpp 


你 现在 可 以 检查 该 模拟 器 的 源 代码 ， 应 该 可 以 看 到 我 们 的 工具 重 命 名 了 所 有 指定 方法 的 
定义 和 调用 。 任 务 到 此 结束 ,但 你 可 以 下 一 节 中 找到 更 多 资源 ， 进 一 步 学 习 有 关 LLVM 的 


知识 。 


10.5 ”其 他 资源 

可 以 在 以 下 链接 中 找到 更 多 的 资源 : 

e http://clang.llvm.org/docs/HowToSetupToolingForLLVM.html : 该 
链接 包含 有 关 如 何 设置 编译 命令 数据 库 的 更 多 说 明 。 一 旦 生成 编译 目录 数据 库 ， 甚 
至 可 以 配置 你 喜欢 的 文本 编辑 器 来 运行 按 需 检查 代码 的 工具 。 
http://clang.11vm.org/docs/Modules .html : 该 链接 提供 有 关 C/C++ 模 
块 的 Clang 实现 中 的 更 多 信息 。 
http://clang.llvm.org/docs/LibASTMatchersTutorial: 这 是 关于 使 用 
AST 匹配 器 和 LibTooling 的 另 一 个 教程 。 
http://clang.llvm.org/extra/clang-tidy.html : 这 里 有 Clang Tidy 以 
及 其 他 工具 的 用 户 手册 。 
http://clang.llvm.org/docs/ClangFormat.html : 提供 ClangFormat 的 
用 户 手册 。 
http://www.youtube.com/watch?v=yuIOGfcOHOk : 提供 Chandler Carruth 
为 C++ Now 制作 的 关于 如 何 构 建 重 构 工具 的 演示 。 


10.6 总结 


在 本 章 中 ,我 们 介绍 了 如 何在 LibTooling 基础 架构 之 上 构建 Clang 工具 ，LibTooling 
库 使 你 可 以 轻松 编写 在 C/C++ 源 代码 级 别处 理 代码 的 工具 。 我 们 介绍 了 以 下 工具 : Clang 
Tidy 是 Clang 的 代码 检查 工具 (linter) ; Clang Modernizer (代码 转换 器 ) 可 以 自动 用 符合 
新 编程 规范 的 C++ 代码 替换 旧 代 码 ; Clang Apply Replacements (替换 执行 器 ) 应 用 由 其 他 
重 构 工具 创建 的 代码 补丁 ; Clang Format (格式 化 工具 ) 可 以 自动 缩 进 和 格式 化 C++ 代码 ; 
Modularize (模块 化 工具 ) 简化 了 尚未 标准 化 的 C++ 模块 框架 的 使 用 ; PPTrace 用 于 记录 预 
处 理 器 的 活动 ; Clang Query 用 于 测试 AST 匹配 器 。 最 后 ， 我 们 通过 展示 如 何 创建 自己 的 工 
具 来 结束 本 章 。 

本 书 到 此 结束 ， 但 这 绝 不 意味 着 你 的 学 习 也 就 此 结束 。 除 了 教程 和 正式 的 文档 以 外 ， 互 联 
网 上 还 有 很 多 关于 Clang 和 LLVM 的 额外 资料 。 此 外 ，Clang/LLVM 一 直 在 不 断 发 展 ， 并 引入 
了 值得 研究 的 新 特性 。 要 了 解 这 些 信 息 ， 请 访问 LLVM 博客 http://blog.11vm.org。 
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